unsupervised-learning

    1熱度

    1回答

    關於訓練LDA: 當我們試圖實現LDA,我們需要構建一個詞 - 文檔矩陣,但該矩陣是稀疏的數據,因爲我們的令牌字典是非常大的(有的數百萬字),並且一個文檔有一小組令牌(〜1000 - 10000個字),因此在文檔 - 文檔矩陣中,它具有很多0值,並且需要更長時間來訓練模型。那麼我們怎樣才能更快? 關於預測新文件: 訓練後,現在我們有一個新的LDA模型,所以我們可以用它來預測哪些主題一個新的文件。但

    1熱度

    1回答

    我有一個關於使用點雲的聚集來執行聚類的問題,其中一個維度 - 代表時間 - 有點受到保護。 爲了使超清晰,考慮這個視頻 用肉眼人們可以看到一些濃密雲層飛來飛去像蚊子,它們可能代表幾件事情進入和離開現場。現在假設我們有一個3維點(X,Y,時間)的數組,並應用一些天真的集羣(比如DBSCAN) 現在聚類相當不錯,除了會議事件在考慮相同的羣集,提出了X軌跡。現在,如果有不同的方式來處理第三個座標,也許人

    0熱度

    1回答

    例如,Kmeans聚類 - 它是作爲神經網絡算法實現的嗎?

    0熱度

    1回答

    我對歷史數據的分類變量執行了k模式聚類。我做了聚類,因爲我想看看數據落入了什麼樣的簇。現在我有了輸出,如果有新數據進來,有什麼方法可以預測它會落入的羣集。 一種方法可能是,因爲我有每行的數據和它所屬的集羣,我可以將它用作列車數據並進行監督式學習。但我想知道是否有任何可能的方法存在,我可以使用現有的輸出變量來預測(半監督學習) 我可能無法共享任何數據或輸出,因爲我工作一個客戶,但如何處理的任何方向將

    0熱度

    1回答

    我有一個39列的數據幀,每列都有不同的正常範圍。 通過使用正常範圍,我想找出正常值,並把0否則把1. 這是我所做的,但我想爲39列做。 val test :(Double => Double) = (value: Double) => { if(value >= 45 && value <= 62) 0 else 1 } 但我不明白如何使用不同的值到每一列。 用於離:

    1熱度

    2回答

    我想使用輪廓分數爲我的數據集選擇最佳數量的簇。我的數據集是關於2,000多個品牌的信息,包括購買此品牌的客戶數量,品牌的銷售量以及品牌在各類別下銷售的商品數量。 由於我的數據集非常稀疏,因此我在集羣之前使用了MaxAbsScaler和TruncatedSVD。 我使用的聚類方法是k-means,因爲我最熟悉這個(我會感謝你對其他聚類方法的建議)。 當我將羣集數量設置爲80並運行k均值時,每次都得到

    1熱度

    1回答

    從準備咖啡網絡數據的腳本中,下面的一段代碼將圖像(表示圖像的numpy數組)轉換爲基準對象。 datum = caffe_pb2.Datum( channels=3, width=224, height=224, label=label, data=np.rollaxis(img, 2).tostring()) 如果網絡監督的,你只是創

    -1熱度

    2回答

    我正在使用K-Mode集羣來對分類數據進行集羣,但是當我用相同數量的集羣聚集數據時,它每次都返回不同的集羣大小 我期待如果我使用相同的數據和相同數量的羣集運行它,羣集大小將始終是固定的 我做錯了什麼? library(klaR) mysample=read.csv("sample_to_cluster.csv") results1 <-kmodes(mysample[,2:ncol(mysam

    0熱度

    1回答

    幫我解決這個問題: 我想弄清楚如何分組這些動物。 比方說,你每天都會觀察到一組動物像朋友一樣閒逛。 你想找出最好的方法來根據他們最喜歡的人自己分組。 爲了說明這一點,你觀察: 今天,你看到這些動物冷了起來: {大象老虎長頸鹿孔雀} 你看到這些第二天: {長頸鹿孔雀大象獅子猴} 然後第二天: {大象老虎鬣狗犀牛} 從這個 所以,你可能會認爲大象和TH e Tiger是好朋友,因爲他們在兩個不同的場合

    0熱度

    1回答

    我在我的Java項目中使用了ELKI提供的k-means實現之一。 我想在實際運行k-means之前運行min-max規範化,但我不明白什麼是使用庫API來完成它的正確方法。 有人能指引我正確的方向嗎?