2017-01-03 131 views
0

我有一個數據集,我知道有3個類。假設我想對這個數據集執行k-means分類,k = 10。我會獲得10個集羣。我將如何將這10個羣集合併到3個類中,並根據我要做什麼規則(例如距離度量)?K均值分類

非常感謝

回答

1

你可以在你的集羣再次運行K-均值,這一次設置K = 3。或者你可以對它們執行期望最大化。或者你可以用蠻力去測試所有120種將10個簇合併爲3的方法。

做事的正確方法是從一開始就設置k = 3。具有錯誤類別的k-means解決方案可能非常不合適。

+1

這可能是因爲數據有3個類別,但分爲10個不同的區域,所以運行K = 3的Kmeans將不起作用,因爲它使用最接近的質心進行分類。例如,異或問題有2個類,但不適用於K = 2,您需要K = 4,然後進行額外合併。 –

+1

似乎合併邏輯將完全依賴於問題,然後。 –