topicmodels

    0熱度

    1回答

    我有一個名爲train_dtm的DocumentTermMatrix,我想規範所有文檔中術語頻率的頻率計數。我現在面臨的問題是所產生的基質也應該是類型DocumentTermMatrix的,因爲我想歸一化矩陣傳遞給TopicModels包的另一種方法LDA在R. 下面是我使用的方法: docs_dtm <- DocumentTermMatrix(docs) 現在,我希望上面的documentt

    32熱度

    5回答

    我做使用topicmodels包R.我創建一個語料庫對象,做一些基本的預處理,然後創建一個DocumentTermMatrix主題建模: corpus <- Corpus(VectorSource(vec), readerControl=list(language="en")) corpus <- tm_map(corpus, tolower) corpus <- tm_map(corpus,