k-means

    6熱度

    1回答

    我想對 mahout kmeans聚類示例(synthetic_control示例)的輸出執行「clusterdump」。但是我遇到了以下錯誤: > ~/MAHOUT/trunk/bin/mahout clusterdump --seqFileDir clusters-10-final --pointsDir clusteredPoints --output a1.txt MAHOUT_LOC

    0熱度

    2回答

    我試圖按照許多在線教程來運行Mahout中的kmeans示例。 但是還沒有成功獲得有意義的輸出。我面臨的主要問題是, 從文本文件轉換爲序列文件並返回。 當我遵循「亨利馬烏維基」的步驟的「合成的控制數據的羣集」 (https://cwiki.apache.org/MAHOUT/clustering-of-synthetic-control-data.html )我可以運行集羣過程(使用$ MAHOU

    2熱度

    1回答

    我想在openCV(使用C)中的圖像上實現kmeans集羣。而不是聚集的圖像導致一些顏色層,輸出是非常奇怪的。我也嘗試調試代碼,但無法理解它可能出錯的地方。 這裏是輸入和輸出圖像。 右邊一個是輸出與左一個是輸入圖像。 下面是代碼: image = cvLoadImage("pic65.png", CV_LOAD_IMAGE_UNCHANGED); sample = cvCreateMat(ima

    0熱度

    1回答

    可能重複: How do I determine k when using k-means clustering? 我們如何確定K值(簇數)對於第k-means算法??

    2熱度

    1回答

    嗨我想知道在圖形屏幕上羣集數據時,是否有辦法在滾動時顯示數據點屬於哪些行? 從上面的圖片中,我希望會有其中,如果我選擇的方式或捲動,我可以告訴它屬於哪一行的點。 下面是代碼: %% dimensionality reduction columns = 6 [U,S,V]=svds(fulldata,columns); %% randomly select dataset rows = 10

    0熱度

    1回答

    我有一個1000x6數據集,並使用下面的kmeans腳本是好的,但是當我想輸出其中一個集羣時,它只能作爲一個列出現? %% cluster opts = statset('MaxIter', 100, 'Display', 'iter'); [clustIDX, clusters, interClustSum, Dist] = kmeans(data, K, 'options',opts, .

    5熱度

    1回答

    我正在嘗試使用ggplot2創建一個包含6個數據變量的對圖,並根據它們所屬的k-均值聚類對這些點進行着色。我閱讀了令人印象深刻的「GGally」套裝的文檔以及Adam Laiacano的非正式修復[http://adamlaiacano.tumblr.com/post/13501402316/colored-plotmatrix-in-ggplot2]。不幸的是,我找不到任何方法來獲得所需的輸出。

    1熱度

    1回答

    爲了得到畸變函數(每個點到它中心的距離之和),K表示通過Scikit-Learn進行聚類,一種簡單的方法就是獲取中心(k_means.cluster_centers_)和總結每個點的距離。 想知道是否有更快的方法嗎? (就程序員而言)類似於直接函數調用等等。

    0熱度

    2回答

    我一直在Cloudera演示VM中使用Mahout進行試驗,並已成功將示例綜合控制數據(https://cwiki.apache.org/MAHOUT/clustering-of-synthetic-control -data.html)使用k-Means算法。我使用了ClusterDumper並可以查看Mahout輸出,但現在我想將輸出放入Hive表中。我會如何去做這件事?

    2熱度

    1回答

    我有一組對象不直觀地適合cv::Mat,我想對它們進行聚類。我在任何兩個對象之間定義了一個距離函數,並且我已經將OpenCV引入到了我的項目中,所以使用它的實現似乎很方便。 所以,我的問題是,鑑於定義的距離函數,我可以使用OpenCV的k-means聚類實現時,對象不直觀cv::Mat兼容?