2017-08-02 84 views
0

我是新來的主題建模和種類的困惑。我已經多次用不同的主題數量值運行MALLET。那麼我怎麼知道選擇哪一個進行進一步分析呢?我知道有些論文涉及主題模型的評估,但我不能編寫這樣的代碼。選擇一個主題模型

+0

如果你不能編碼這樣的東西,你問這個問題,編碼問題和答案平臺,我很困惑你在問什麼。 – Rob

回答

1

不要將主題的數量視爲文檔的自然特徵。它們並不是多項分佈的組合,所以沒有「正確的」答案。有很多很好的價值。

您應該將主題的數量視爲集合的地圖比例。如果您想要廣泛的概述,請使用較少的主題。如果你想要更多的細節,請使用更多。正確的數字是產生有意義的結果的值,可以讓您完成目標。