2017-03-08 72 views
1

我訓練AK意味着我的數據集模型,現在我想獲得從每個集羣的幾個要素與集羣ID獲得集羣和集羣的第一要素IDS k均值火花

val clusters = KMeans.train(data, numClusters, numIterations) 

val vectorsAndClusterIdx = data.map{ point => 
    val prediction = clusters.predict(point) 
    (point.toString, prediction) 
} 

沿着但後來有一次我有,我不知道如何打印這些元素與他們的羣集ID

回答

1

如果我瞭解你,你想打印每個點與其分配的羣集ID。

你可以嘗試這樣的事:

vectorsAndClusterIdx.collect().foreach(println(_)) 

或者,也許它會更好:

println(dataClustered.collect().mkString("\n")) 
+0

謝謝你,你的第一個解決方案的偉大工程:)我想究竟是什麼,如果可能的話,從每個集羣中獲得10個元素 –

+0

@ laure-d:如果您對以上答案還可以,請注意投票/接受答案 –

+0

我是,但不是完全的,我的意思是,我會感激只得到10個如果可能的話,來自每個羣集的元素,而不是所有元素 –