k-means

    3熱度

    3回答

    在MATLAB k-means 實現中是否存在傳遞自定義距離函數(例如jaccard距離)的方法? 傑卡德距離函數 D = pdist(X,'jaccard');

    0熱度

    1回答

    我無法找到關於種子的matlab's k-mean的詳細信息。如果matlab的k均值重新計算作爲data set X矩陣子集的Xs seeds的聚類分配。 或者這些種子只用於初始中心位置,並不考慮k-均值聚類分配階段? 我想要semi-supervised clustering by seeds作者:Sugato Basu et.al 這可能是一個天真的問題,但你的答案會使這個混淆更清晰。 在此

    0熱度

    1回答

    我正在做一個程序語音識別的語音。 使用MFCC + K均值+ GMM,我得到了一個可能性像-15012,-43400,-8000 這是比我大那麼雖然價值。這是正確的價值嗎? 波形文件的長度通常爲2〜3,我初始使用下面的選項。 MFCC option SampleRate = 16000 WindowSize = 256 NumberCoefficients = 13 UseFirstCoe

    1熱度

    2回答

    什麼是最佳色彩空間(如RGB,HSV,YIQ,XYZ,Lab)用於使用K-Means聚類方法將圖像聚類到具有白色背景的圖像以及除了白色背景之外的其他顏色的一個以上的對象,就像白色布上的一些水果的圖像,其具有足夠的光。附加信息:集羣被確定爲兩個集羣並且分割的結果是兩個集羣,第一個是背景的集羣(布的白色),第二個是對象或某些對象的集羣。以前感謝。

    0熱度

    1回答

    我一直使用Mahout來使用XML和SOLR索引輸入的k-means集羣文本文檔。 聚類看起來很有效,類似的文件確實被放在同一個k-means聚類中,這很好。但是,無論何時使用ClusterDump顯示graphml輸出(--outputFormat GRAPH_ML),我都會得到一個顯示所有集羣的圖,但每個元素顯示在其父集羣周圍,這意味着每個元素都具有大致相同的半徑從質心。 我期待元素散佈在整個

    0熱度

    2回答

    我想區分兩個種羣。每個種羣都是一個N×M矩陣,其中N在兩個之間固定,M的長度可變(N =每次運行的列特定屬性,M =運行數)。我已經看過PCA和K-means來區分這兩者,但我對最佳做法感到好奇。 據我所知,在K-means中,沒有初始的「校準」,在這個初始的「校準」中選擇了聚類,以便可以區分已知的雙峯羣。它只是最小化距離並將數據分配給任意數量的種羣。我想告訴聚類算法,我希望兩個種羣分開的最適合。

    3熱度

    1回答

    我希望能夠stream kmeans,這意味着在對一組數據進行聚類後,我想向集羣添加其他數據或創建新集羣,而無需運行舊數據。 我做了很多搜索,但無法找到此代碼的matlab實現,但是有很多C源代碼。有人知道這樣的事嗎?

    0熱度

    3回答

    有誰知道從圖像中提取字符的好算法。所有的角色都是黑色的,背景是白色的。事實上,這些圖像將只是一個印刷文件。我正在考慮使用搜索算法(如DFS或BFS)來聚類角色,但我不確定是否有更好的方法?你可以建議圖書館可以做到這一點嗎?我只是想將圖像剪切成較小的圖像,每個圖像都代表一個字符。

    2熱度

    1回答

    所以我有一個3個綠色斑點的視頻。這些點在他們的周邊有很多「很好的功能」。 這些斑點距離彼此很遠,所以使用KMeans我很容易將它們識別爲單獨的簇。 問題在於,集羣的排序因幀而異。在一個框架中,特定的羣集是輸出列表中的第一個。在下一個集羣中,它是輸出列表中的第二個集羣。 這是一個困難的時間測量角度。 有沒有人遇到過這個問題,或者可以想出一個解決方案,而不是編寫額外的代碼來比較每個列表與前一幀的列表?

    0熱度

    1回答

    mahout-0.7是否仍支持內存和MR KMeans集羣?在早期版本中,它具有用於內存集羣的KmeansClusterer和用於MapReduce集羣的KmeansDriver。但是,KmeansClusterer似乎已從mahout0.7中刪除。