2016-12-02 84 views
0

我想使用GenSim的LDA模塊做以下任務上GenSim

「培養出LDA模型與一個大文件,並保持10個潛在主題的軌道。計算一個看不見的文檔的主題分佈賦予了新的,看不見的文件,預測10個潛在主題的概率分佈「。

根據教程在這裏:http://radimrehurek.com/gensim/tut2.html,這似乎是可能的文件在一個語料庫,但我想知道它是否有可能爲一個看不見的文件。

謝謝!

回答

0

從文檔您發佈它看起來像你可以訓練你的模型是這樣的:

>>> model = models.LdaModel(corpus, id2word=dictionary, num_topics=100) 

然後從this page它看起來像你可以在「看不見的文檔」像這樣的應用模型:

>>> doc_lda = model[doc_bow] 

其中doc_bow是由doc2bow工具生成的袋裝文字。