0
我使用PCA將文檔減少到2點,以便可以將它們可視化。 我的方法看起來像這樣。向PCA模型添加一個點
pipeline = Pipeline([('tfidf', TfidfVectorizer())])
X = pipeline.fit_transform(sent_list).todense()
pca = PCA(n_components = 2).fit(X)
data2D = pca.fit_transform(X)
然後我使用matplotlib plt.scatter繪製它們(data2D [:,0],data2D [:,1],C = label_colour)
我要添加新2點和看他們落在模型中。到目前爲止,我在最後的訓練數據中包含了初始點,並在陣列中的最後兩個位置繪製了一個X,但我不確定這是否是它們的值的真實反映。任何見解都會很棒。