2
我正在開發一個項目,在該項目中,我利用未標記數據集的聚類結構來改進監督學習聚類算法的性能。存儲在一個矩陣 - - 預處理該數據後,我使用k均值聚類,像這樣的數據:K均值聚類 - 在每個聚類中繪製類別比例
from sklearn.cluster import KMeans
k = KMeans(n_clusters=40).fit(X)
我具有存儲在y
所需標籤。我對看到不同的類是如何聚類的感興趣。如果這些集羣相對純粹或混合。
爲此,我想查看每個集羣中每個類的比例。這是一個二元分類任務 - 正數(用y表示)和負數表示(用y表示)。
(在y陣列的第n個元素是X矩陣的第n行正確的標籤。)
什麼是_positive_和_negative_實例? – DyZ
@DYZ編輯過的問題。 – scutnex