2016-07-27 78 views
0

我已經在數據集上實現了k-means聚類。我試圖通過查看快速採礦者給出的平行和偏差圖來分析聚類k。分析簇均勻性並使用RapidMiner中的簇距離性能算子

其目的是分析簇的均勻性。在給定的各種性能模型中,運算符「簇距離性能」運算符用於k均值聚類的結果。

  1. 是否有其他運營商可以提供此類分析?
  2. 我擁有的數據集具有較大的數值向量(在 數百和數千),我也有一個數據集,其極小值(小數點後5至8位)極其小。

我不知道如何解釋,我從運營商「羣集距離性能」得到的結果如下圖所示

重心表結果

enter image description here

和高性能矢量操作結果是

enter image description here 有人可以幫我這個嗎?儘管我認爲Davies Bouldin的價值越小,集羣越好。

回答

0

如果您試圖找到「最佳」聚類,那麼您必須改變k並計算不同的聚類有效性度量,以比較k隨k變化而變化的方式。 Davies-Bouldin通常是一個不錯的選擇,因爲「最好」的信號最低。最好的定義是從用於構造有效性度量(基於聲音和邏輯技術)的數學技術的角度來看的,但人們總是必須查看聚類來確定結果是否實際上意味着什麼。

+0

如果您需要一些關於編寫一個過程來遍歷k的所有可能值並計算有效性度量的指導,您可以在這裏看到一個示例http://rapidminernotes.blogspot.co.uk/2011/03/counting-集羣部分-ii.html – awchisholm