unsupervised-learning

1熱度

1回答

對於稀疏數據，訓練LDA（潛在Dirichlet分配）並預測新文檔的更快方法是什麼？

關於訓練LDA：當我們試圖實現LDA，我們需要構建一個詞 - 文檔矩陣，但該矩陣是稀疏的數據，因爲我們的令牌字典是非常大的（有的數百萬字），並且一個文檔有一小組令牌（〜1000 - 10000個字），因此在文檔 - 文檔矩陣中，它具有很多0值，並且需要更長時間來訓練模型。那麼我們怎樣才能更快？關於預測新文件：訓練後，現在我們有一個新的LDA模型，所以我們可以用它來預測哪些主題一個新的文件。但

1熱度

1回答

聚類時間事件

我有一個關於使用點雲的聚集來執行聚類的問題，其中一個維度 - 代表時間 - 有點受到保護。爲了使超清晰，考慮這個視頻用肉眼人們可以看到一些濃密雲層飛來飛去像蚊子，它們可能代表幾件事情進入和離開現場。現在假設我們有一個3維點（X，Y，時間）的數組，並應用一些天真的集羣（比如DBSCAN）現在聚類相當不錯，除了會議事件在考慮相同的羣集，提出了X軌跡。現在，如果有不同的方式來處理第三個座標，也許人

0熱度

1回答

是否將Tensorflow中的所有內容都實現爲NN？

例如，Kmeans聚類 - 它是作爲神經網絡算法實現的嗎？

0熱度

1回答

使用k模式輸出來預測

我對歷史數據的分類變量執行了k模式聚類。我做了聚類，因爲我想看看數據落入了什麼樣的簇。現在我有了輸出，如果有新數據進來，有什麼方法可以預測它會落入的羣集。一種方法可能是，因爲我有每行的數據和它所屬的集羣，我可以將它用作列車數據並進行監督式學習。但我想知道是否有任何可能的方法存在，我可以使用現有的輸出變量來預測（半監督學習）我可能無法共享任何數據或輸出，因爲我工作一個客戶，但如何處理的任何方向將

0熱度

1回答

使用scala數據幀中的最小值和最大值來尋找正常值

我有一個39列的數據幀，每列都有不同的正常範圍。通過使用正常範圍，我想找出正常值，並把0否則把1. 這是我所做的，但我想爲39列做。 val test :(Double => Double) = (value: Double) => { if(value >= 45 && value <= 62) 0 else 1 } 但我不明白如何使用不同的值到每一列。用於離：

1熱度

2回答

相同數據和簇數的不同輪廓分數

我想使用輪廓分數爲我的數據集選擇最佳數量的簇。我的數據集是關於2,000多個品牌的信息，包括購買此品牌的客戶數量，品牌的銷售量以及品牌在各類別下銷售的商品數量。由於我的數據集非常稀疏，因此我在集羣之前使用了MaxAbsScaler和TruncatedSVD。我使用的聚類方法是k-means，因爲我最熟悉這個（我會感謝你對其他聚類方法的建議）。當我將羣集數量設置爲80並運行k均值時，每次都得到

1熱度

1回答

caffe中的基準對象 - 無監督網絡

從準備咖啡網絡數據的腳本中，下面的一段代碼將圖像（表示圖像的numpy數組）轉換爲基準對象。 datum = caffe_pb2.Datum( channels=3, width=224, height=224, label=label, data=np.rollaxis(img, 2).tostring()) 如果網絡監督的，你只是創

-1熱度

2回答

R中的k模式集羣返回不同的集羣大小，每次運行

我正在使用K-Mode集羣來對分類數據進行集羣，但是當我用相同數量的集羣聚集數據時，它每次都返回不同的集羣大小我期待如果我使用相同的數據和相同數量的羣集運行它，羣集大小將始終是固定的我做錯了什麼？ library(klaR) mysample=read.csv("sample_to_cluster.csv") results1 <-kmodes(mysample[,2:ncol(mysam

0熱度

1回答

根據以往觀察到的分組排列最佳數據分組

幫我解決這個問題：我想弄清楚如何分組這些動物。比方說，你每天都會觀察到一組動物像朋友一樣閒逛。你想找出最好的方法來根據他們最喜歡的人自己分組。爲了說明這一點，你觀察：今天，你看到這些動物冷了起來： {大象老虎長頸鹿孔雀} 你看到這些第二天： {長頸鹿孔雀大象獅子猴} 然後第二天： {大象老虎鬣狗犀牛} 從這個所以，你可能會認爲大象和TH e Tiger是好朋友，因爲他們在兩個不同的場合

0熱度

1回答

ELKI：在運行k-means之前執行min-max規範化

我在我的Java項目中使用了ELKI提供的k-means實現之一。我想在實際運行k-means之前運行min-max規範化，但我不明白什麼是使用庫API來完成它的正確方法。有人能指引我正確的方向嗎？