我正在研究一個文件來預測診斷患有糖尿病的患者(水平從1到10)的治療方式。 有8種不同的治療建議(256種可能的結果),我需要對它們進行聚類(我有來自原始文件的21個屬性)。所以我在SimpleKMean中使用了19k。問題是我得到了「沒有課程」分配給一些集羣;Weka - 沒有課程也沒有集羣分配
此外,當我把它歸類爲評價,我也有同樣的問題,「沒有集羣」分配給類,也是我失去了一些數據。例如,有940個實例,但分類後我有876個實例。
但混淆矩陣顯示確切的數字。我不知道它是否相關,但可能有助於解決問題。我已經使用了AddCluster方法,因爲我的所有屬性都是數值型的,而且我需要原始文件中的附加列才能顯示「Treatment Cluster」(第22個屬性)。所以我運行SimpleKMean和交叉驗證這個新的附加屬性,這也是我的課程。
非常感謝您的幫助!
感謝您的鏈接馬修 – user2097866 2014-10-13 05:47:55