1
我一直在嘗試使用不同的方法來確定LDA中的主題頻率(在R中),並且偶然發現了非常有用的包ldatuning,但無法真正弄清楚控制參數,特別是種子的示例值。'種子'在'ldatuning'中確定LDA主題頻率(R)的含義是什麼?
下面是從網站的示例代碼:
library("topicmodels")
data("AssociatedPress", package="topicmodels")
dtm <- AssociatedPress[1:10, ]
result <- FindTopicsNumber(
dtm,
topics = seq(from = 2, to = 15, by = 1),
metrics = c("Griffiths2004", "CaoJuan2009", "Arun2010", "Deveaud2014"),
method = "Gibbs",
control = list(seed = 77),
mc.cores = 2L,
verbose = TRUE
)
我與參數有點發揮各地,並注意到,在種子的價值的變化而改變輸出曲線相當顯著。有人能解釋一下這個例子中的77是什麼意思,以及如何選擇種子的價值?
另外,我無法找到任何其他選項來輸入控件的內容以及對結果有什麼影響。如果任何人都可以在這裏提供一些很好的指導。