我目前正在學習聚類。我執行我的數據庫中存儲的用戶的average_duration_of_call k-mean羣集。在首次運行3箇中心 cluster1(53.33369秒)-367訂戶,cluster2(121.67123秒)-128訂戶,cluster3(369.09000秒)-8訂戶。如何從不同的中心找到最佳的K均值聚類
我再次重新運行聚類中心6和中心獲得如cluster1中(904.66670秒)-1訂戶,Cluster2中(27.7秒) - 108訂戶,cluster3(151.58)-43訂戶,cluster4(95秒) - 135用戶,cluster5(59.5秒) - 207用戶,cluster6(278秒)-9用戶。
現在我的問題是哪個是最好的集羣以及如何找到最佳集羣。我期望有任何經驗幫助(我目前使用R語言)
請給這個問題的任何參考書名稱。 – Krish 2013-04-30 12:05:45
也BIC的意思是[貝葉斯信息標準](http://en.wikipedia.org/wiki/Bayesian_information_criterion)或其他? – Krish 2013-04-30 12:11:14
請參閱Gan,Ma,Wu的「Data Clustering」,它對存在的各種變體有相當詳盡的說明。事實上,許多分類繁多的書籍,如Weka書幾乎沒有觸及羣集。例如,查找x-means算法,它使用BIC I相關。 – 2013-04-30 15:49:35