我正在試圖爲一個語料庫,一個使用unigrams,一個使用bigrams製作兩個文檔項矩陣。然而,二元矩陣當前與單元矩陣相同,我不知道爲什麼。從的ngram包作爲標記生成器,但是這並不工作 docs<-Corpus(DirSource("data", recursive=TRUE))
# Get the document term matrices
BigramTokenizer <- fu
我正在嘗試安裝軟件包RWeka。我安裝了Java版本8,但我不斷收到此錯誤。任何人都可以幫忙嗎? > install.packages('RWeka')
There is a binary version available but the source version is later:
binary source needs_compilation
RWeka 0.4-26 0