k-means

    0熱度

    2回答

    我有一組點,並且我想要羣集。我知道如何做正常的k-means算法。但我不想以'k'作爲輸入。假設如果我有點像 1,3,4,50,60,70,1000,10002,10004該算法應該將它們聚類爲3個羣集 C1:1,3,4 C2:50,60,70 C3 :1000,1002,1004 滿足集羣內元素之間的距離應該是最小的,並且集羣間的距離應該是最大的。

    0熱度

    1回答

    我很抱歉,我不知道如何使用HTML或其他任何東西來真正讓它看起來很「漂亮」。特別是爲了讓我的示例數據對你有用。我正在學習這一點。 我想對變量PersVel,TurnVel和Velocity(也可能是其他人,但這些會暫時做)運行聚類分析。我的數據已經按年分開了,但每年有不同數量的個人(ID是這些人的姓名)。我想對每個個體的這些變量運行k-means和/或等級聚類分析。以下數據只有20個數據點。一旦根

    2熱度

    1回答

    在我的數據中,我有一些喜歡的用戶,我已經將這些喜歡傾倒到每個用戶的單個文件中,並希望對它們進行聚類。除了輸出在多個羣集中具有相同的喜歡之外,一切正在工作。我的理解是k-means應該是排他性的。我認爲問題可能在於我如何傾銷數據。我也暫時拋棄了所有沒有空格的喜歡,直到我可以編寫自定義標記器。以下是我正在運行的內容(來自ruby腳本)。 system("#{MAHOUT_CMD} seqdirecto

    2熱度

    2回答

    我用MFCC算法得到了一些聲音變量的特徵。我想用K-Means對它們進行聚類。我有70幀,每個幀有9個倒譜系數用於一個音色樣本。這意味着我有一個像70 * 9大小的矩陣。 讓我們假設A,B和C是語音記錄,這樣 A是: List<List<Double>> -> 70*9 array (I can use Vector instead of List) 而且B和C具有相同的長度了。 我不想聚簇每

    0熱度

    1回答

    我在我的K-means算法中有每個簇的列表變量。我怎樣才能找到新的意味着每個羣集的?

    -1熱度

    3回答

    我如何計算兩個文檔之間的距離?在數字的k-means中,你必須計算兩點之間的距離。我知道我可以使用餘弦函數。 我想對rss文件執行羣集。我已經完成了並刪除了文檔中的停用詞。我已經在每個文檔中統計了單詞的頻率。現在我想實現k均值算法。

    4熱度

    2回答

    可能重複: How do I determine k when using k-means clustering? 如何選擇K個開始,如果我不知道這個數據? 有人可以幫助我在選擇K. 感謝 納文

    0熱度

    2回答

    如何計算重建錯誤,以及在哪裏可以找到關於它的信息? (我將計算K均值算法後數據的重構誤差)

    2熱度

    3回答

    給定一個NxM特徵向量作爲numpy矩陣。是否有任何可以使用L1距離(曼哈頓距離)的Kmeans算法對其進行聚類的例程?

    3熱度

    3回答

    我試圖實現基於紙張「可擴展識別與詞彙樹」的圖像搜索。我正在使用SURF來提取特徵和關鍵點。例如,對於一幅圖像,我會說300個關鍵點,每個關鍵點都有128個描述符值。我的問題是如何在數據上應用K-Means Clustering算法。我的意思是我是否需要在所有點上應用聚類算法,即300 * 128值,還是我需要找到連續的描述符值之間的距離並存儲這些值,並在其上應用聚類算法。我很困惑,任何幫助將不勝感