2016-07-11 86 views
0

我正在使用R中的PAM進行聚類分析。我使用vegdist()計算了我的數據的gower距離,並使用pam()計算了一個簇變量,效果很好。現在我需要一個措施來確定正確的k。我知道的方法是在視覺上比較不同k的平方和。我如何從一系列PAM迭代中獲取WSS來比較一個圖中的總和,類似於kmeans的這個例子? http://rstudio-pubs-static.s3.amazonaws.com/137758_a80b40255fdd440ab76b41a646a6c482.html#loops在R中的PAM聚類分析的平方和內計算

+0

WSS是k-means的目標函數,但是你不使用k-means。爲什麼不使用PAM目標函數? –

+0

什麼是正確的方法來做到這一點? – mango

+0

請參閱'?pam.object'作爲'objective'字段。 –

回答

1

PAM不優化WSS。 WSS是k-means的目標。

相反,使用PAM目標

objective場見?[pam.object][1](在文獻中也可以叫做TD):

objective

目標函數的第一和第二後pam算法的一步。

要注意的是類似於WSS,objective應該隨k以減小。因此,你不能只選擇最低限度,但你應該在劇情中尋找膝蓋。

由於PAM是隨機的,您可能需要多次運行每個k,並保持最佳結果。

+0

謝謝,PAM的理論背景和R函數的結構之間的聯繫是這裏缺失的鏈接! – mango