2011-10-08 53 views
1

fuzzy c-means可以應用於非數值數據集嗎?即分類或混合數值和分類.. 如果是(我希望如此:():模糊c-表示分類數據

  • 我們如何計算集羣中心

如果沒有,什麼是另類..如何模糊聚類這些數據

我所需要的響應,請幫助

注:我用的Jacard的係數,計算2點之間的距離,但還是沒有得到計算集羣中心看到的樣子附件enter image description herejacard coefficient

+0

爲什麼它沒用或不清楚?請告訴我 – AWRAM

回答

4

您必須將數據轉換爲數字形式。有這樣做的,他們兩個是不同的方式:

  • 功能計數的使用向量(在,例如,文本分類常見)
  • 使用一熱表示,其中一個分類功能,可以採取上ñ不同的值被表示爲ñ比特串,只有個在其允許的範圍值「如果第一個功能具有位設爲」。

這兩個都是很多機器學習程序在底層進行的非常常見的轉換。此外,您可能想要嘗試與歐幾里得不同的度量標準。 ESP。以一次性表示,但根據數據,L1標準(曼哈頓/城市街區距離)可能更合適。

除此之外,只需將給定的公式應用於轉換後的數據集。

+0

謝謝你的回答,可以請你檢查更新後的問題 – AWRAM

+0

@AWRAM:我不認爲Jaccard係數在一般情況下會產生平均值,所以你需要切換到數字表示或[* k * -medoids](http://en.wikipedia.org/wiki/K-medoids)算法 –

+0

假設我們將要素轉換爲二進制表示法,例如我有3個點在一個簇A中,每個成員具有一個成員值如下p1(1000,0.5(成員資格))p2(0100,0.7)p3(0001,0.4)。在這種情況下如何計算均值? – AWRAM