2016-09-23 92 views
0

我正在使用函數kmeans來執行K均值聚類。我可以使用kmeans函數的自定義距離度量嗎?

我有一個需要自定義距離測量功能和自定義平均功能的特殊數據。

我可以將(1)自定義距離度量函數和(2)自定義均值函數應用於kmeans函數嗎?

它似乎只使用歐幾里德測量。

回答

0

標準kmeans不允許這樣做,原因很充分。它使用了一些聰明的算法(Hartigan和Wong;這就是爲什麼它比你在約100個其他R包中找到的標準勞埃德教科書算法更快得多)。但是這些只適用於具有平方偏差的經典k均值場景(這意味着將每個羣集分配到歐幾里得最近的中心,但實際上它優化了最小二乘而不是歐幾里德距離)。

我懷疑你可以簡單地將其他距離和質心函數插入到Hartigan和Wong方法中(除了用Fortran編寫,所以不能只是插入R函數)。

請注意,有非常多的知道其他距離和手段已知總是收斂良好的已知組合。布萊克曼散度應該沒問題,而餘弦相當於球體上的歐幾里德平方,所以它也可以工作。

相關問題