k-means

0熱度

2回答

我有一組點，並且我想要羣集。我知道如何做正常的k-means算法。但我不想以'k'作爲輸入。假設如果我有點像 1,3,4,50,60,70,1000,10002,10004該算法應該將它們聚類爲3個羣集 C1：1,3,4 C2：50,60,70 C3 ：1000,1002,1004 滿足集羣內元素之間的距離應該是最小的，並且集羣間的距離應該是最大的。

0熱度

1回答

r與多個人的聚類分析

我很抱歉，我不知道如何使用HTML或其他任何東西來真正讓它看起來很「漂亮」。特別是爲了讓我的示例數據對你有用。我正在學習這一點。我想對變量PersVel，TurnVel和Velocity（也可能是其他人，但這些會暫時做）運行聚類分析。我的數據已經按年分開了，但每年有不同數量的個人（ID是這些人的姓名）。我想對每個個體的這些變量運行k-means和/或等級聚類分析。以下數據只有20個數據點。一旦根

2熱度

1回答

Mahout上的K-means返回非獨佔集羣

在我的數據中，我有一些喜歡的用戶，我已經將這些喜歡傾倒到每個用戶的單個文件中，並希望對它們進行聚類。除了輸出在多個羣集中具有相同的喜歡之外，一切正在工作。我的理解是k-means應該是排他性的。我認爲問題可能在於我如何傾銷數據。我也暫時拋棄了所有沒有空格的喜歡，直到我可以編寫自定義標記器。以下是我正在運行的內容（來自ruby腳本）。 system("#{MAHOUT_CMD} seqdirecto

2熱度

2回答

如何實現MFCC特徵的K均值聚類算法？

我用MFCC算法得到了一些聲音變量的特徵。我想用K-Means對它們進行聚類。我有70幀，每個幀有9個倒譜系數用於一個音色樣本。這意味着我有一個像70 * 9大小的矩陣。讓我們假設A，B和C是語音記錄，這樣 A是： List<List<Double>> -> 70*9 array (I can use Vector instead of List) 而且B和C具有相同的長度了。我不想聚簇每

0熱度

1回答

如何在K-Means中找到每個羣集的新方法？

我在我的K-means算法中有每個簇的列表變量。我怎樣才能找到新的意味着每個羣集的？

-1熱度

3回答

使用K-means算法進行文檔聚類

我如何計算兩個文檔之間的距離？在數字的k-means中，你必須計算兩點之間的距離。我知道我可以使用餘弦函數。我想對rss文件執行羣集。我已經完成了並刪除了文檔中的停用詞。我已經在每個文檔中統計了單詞的頻率。現在我想實現k均值算法。

4熱度

2回答

如何最佳K的K - 均值算法

可能重複： How do I determine k when using k-means clustering? 如何選擇K個開始，如果我不知道這個數據？有人可以幫助我在選擇K. 感謝納文

0熱度

2回答

如何計算重建誤差？

如何計算重建錯誤，以及在哪裏可以找到關於它的信息？（我將計算K均值算法後數據的重構誤差）

2熱度

3回答

蟒蛇中L1距離的kmeans

給定一個NxM特徵向量作爲numpy矩陣。是否有任何可以使用L1距離（曼哈頓距離）的Kmeans算法對其進行聚類的例程？

3熱度

3回答

在OpenCV中實現詞彙樹

我試圖實現基於紙張「可擴展識別與詞彙樹」的圖像搜索。我正在使用SURF來提取特徵和關鍵點。例如，對於一幅圖像，我會說300個關鍵點，每個關鍵點都有128個描述符值。我的問題是如何在數據上應用K-Means Clustering算法。我的意思是我是否需要在所有點上應用聚類算法，即300 * 128值，還是我需要找到連續的描述符值之間的距離並存儲這些值，並在其上應用聚類算法。我很困惑，任何幫助將不勝感