2017-02-12 106 views
0

我是R.的新手我想知道關於Corpus()的方法。r中的語料庫方法

這是我寫的代碼。

library(tm) 
my_obj<-"learning about corpus method" 
corp<-Corpus(VectorSource(my_obj)) 
corp 

我認爲這代碼的輸出應該是由Corpus方法制備的結構化文本。但輸出是: -

<<VCorpus>> 
Metadata: corpus specific: 0, document level (indexed): 0 
Content: documents: 1 

有人可以解釋在[R做什麼語料庫方法?

+2

請參閱http://stackoverflow.com/questions/30435054/how-to-show-corpus-text-in-r-tm-package –

+0

謝謝,我明白了。 – a874

回答

0

Corpus方法創建一個文本集合(在NLP中稱爲語料庫),使用戶能夠在其上使用大量文本挖掘功能,例如tm-map函數可以刪除標點符號,停用詞,空格,數字。 。,您可以通過在語料庫上使用DocumentTermMatix函數來計算語料庫中每個文檔的詞頻。

相關問題