我想了解LDA主題模型如何在槌子API中實現。在ParallelTopicModel
類中,我可以看到一個稱爲typeTopicCounts
的2D int數組,它在buildInitialTypeTopicCounts()
方法中通過一些按位操作初始化,並稍後用於每個文檔。我的問題是這個數組值意味着什麼?我只能從源代碼中獲得的信息是它被[特徵索引,主題索引]索引。typeTopicCounts功能的主題建模實施槌子API
0
A
回答
0
針對LDA的吉布斯採樣的計算性能主要是通過計算每個詞標記的主題抽樣分佈。話題模型被設置爲在話語和話題之間具有很多稀疏的關係。如果我們可以通過從一個詞到下一個詞節省儘可能多的計算並且只做有意義的計算(比如不乘以零)來使得計算更有效率,那麼我們可以獲得很大的加速。
每個單詞類型在typeTopicCounts
數組中有一個int
s的數組。這個數組中的每個int
值的含義使用位移運算符編碼兩個一個話題和一個令牌計數。計數值位於高位,因此我們可以按「計數」對主題進行排序,而無需「解包」整數。從這個方法的教程
幻燈片都可以在這裏:
https://mimno.infosci.cornell.edu/slides/fast-sparse-sampling.pdf
相關問題
- 1. 使用槌子建模的主題
- 2. 木槌主題建模
- 3. 木槌主題建模 - 主題鍵輸出參數
- 4. 如何實施和使用的子模式從System.Console.CmdArgs功能
- 5. C:實施rownames的功能
- 6. 實施非會員功能
- 7. 實施「IntBitsToFloat」功能在VB.NET
- 8. R主題建模:lda模型標註功能
- 9. 問題實施模型
- 10. Facebook的採訪:實施readline的功能
- 11. 禁用wordpress子主題功能
- 12. 如何實施YouTube的評論功能?
- 13. 實施Excel的小計功能
- 14. 搜索功能的Django項目實施
- 15. 實施Rails的API
- 16. 實施主題4個應用
- 17. 在計劃中實施「收集」功能
- 18. 實施版本控制功能
- 19. 難度實施NSUndoManager重做功能
- 20. 問題而實施軍刀車API
- 21. 未能創建從Sunburst主題模板化的Plone主題
- 22. 實施公共API
- 23. 獲取槌球中所有文檔的實例和主題序列
- 24. iPhone上的Salesforce Api實施
- 25. Drupal主題功能不叫?
- 26. 問題實施攔截模式
- 27. R中的主題建模
- 28. 木槌下載問題
- 29. UIMapkit實施問題
- 30. Backprop實施問題