2017-03-08 353 views
1

我一直在嘗試使用不同的方法來確定LDA中的主題頻率(在R中),並且偶然發現了非常有用的包ldatuning,但無法真正弄清楚控制參數,特別是種子的示例值。'種子'在'ldatuning'中確定LDA主題頻率(R)的含義是什麼?

下面是從網站的示例代碼:

library("topicmodels") 
data("AssociatedPress", package="topicmodels") 
dtm <- AssociatedPress[1:10, ] 

result <- FindTopicsNumber(
    dtm, 
    topics = seq(from = 2, to = 15, by = 1), 
    metrics = c("Griffiths2004", "CaoJuan2009", "Arun2010", "Deveaud2014"), 
    method = "Gibbs", 
    control = list(seed = 77), 
    mc.cores = 2L, 
    verbose = TRUE 
) 

我與參數有點發揮各地,並注意到,在種子的價值的變化而改變輸出曲線相當顯著。有人能解釋一下這個例子中的77是什麼意思,以及如何選擇種子的價值?

另外,我無法找到任何其他選項來輸入控件的內容以及對結果有什麼影響。如果任何人都可以在這裏提供一些很好的指導。

回答

0

種子: 「整數」類的對象;用於設置外部代碼中的種子以進行VEM估計,並調用set.seed進行Gibbs採樣。對於Gibbs採樣,它也可以設置爲NA(默認),以避免在模型擬合調用中更改隨機數生成器的種子。

相關問題