其實我正在爲郵輪公司做評論分析。我不能告訴你整個程序,因爲它很長,但至少是一個快照。我把所有的評論,分成幾個句子,然後從評論中提取一些短語......例如, '美妙的小屋','優質的服務'。現在爲了情感分析,我必須將該短語的所有名詞映射到特定的主題。現在在那個映射中,我需要所有名詞的同義詞和所有關於這個詞的詞語。所以我的文本挖掘的最終結果將會更加高效。我想你對我正在做的事情有一點點想法。 我會重複我的問題..在Excel中我有一行單詞或說名詞..當我運行代碼[R,VBA或任何]它應該給我與這些單詞有關的所有單詞.. [我提取同義詞與vba代碼]。 希望你明白了..?創建詞的其他形式[名詞,形容詞,複數,動詞..一切]
-2
A
回答
4
您可以使用包tm
及其詞幹功能。
如果你的文本文件是
text <- c("taste", "tastes", "tasting")
您可以創建一個文集
corpus <- Corpus(VectorSource(text)
然後有腦幹功能剝離的話他們的根。 (助手功能避免了一些問題。)
stemDocumentfix <- function(x){ # put in business code
PlainTextDocument(paste(stemDocument(unlist(strsplit(as.character(x), " "))), collapse=' '))
}
corpus <- tm_map(corpus, stemDocumentfix)
inspect(corpus)
<<VCorpus (documents: 3, metadata (corpus/indexed): 0/0)>>
[[1]]
<<PlainTextDocument (metadata: 7)>>
tast
[[2]]
<<PlainTextDocument (metadata: 7)>>
tast
[[3]]
<<PlainTextDocument (metadata: 7)>>
tast
您也可以看看qdap
包,它提供了一系列的功能,用於文本挖掘。
相關問題
- 1. 單詞的名詞,動詞,形容詞等的單獨列表
- 2. 將形容詞和副詞轉換爲名詞形式
- 3. 名詞,動詞,形容詞等的單詞列表
- 4. 將單詞識別爲名詞,動詞或形容詞
- 5. SQL名詞複數形式的函數
- 6. Perl模塊查找單詞是否是動詞/名詞/形容詞/文章/介詞
- 7. 如何返回詞的副詞形式
- 8. 應該如何創建Rails控制器?它應該是動詞,名詞還是形容詞?
- 9. 如何命名爲形容詞或介詞的Rails資源?
- 10. 從WordNet獲取名詞和形容詞列表
- 11. 爲「High Score」建議的動詞/名詞
- 12. 詞形化java
- 13. 從名詞詞組獲得動詞python
- 14. 單詞列表的詞形化
- 15. 接口命名爲形容詞
- 16. 用一個句子替換代詞,名詞,動詞和形容詞及其相應的標籤,我怎樣才能在Python中有效地做到這一點?
- 17. 在actionscript-return中的高級文本搜索所有名詞,形容詞和動詞
- 18. 使用詞網找到沒有名詞同義詞或至少有一個名詞同義詞的詞條
- 19. 檢測代詞及其名詞?
- 20. 尋找同義詞和傾斜詞的基本形式
- 21. 有沒有將形容詞連接到它們相應名詞的算法?
- 22. Python - 生成單數名詞的複數名詞
- 23. 將單詞替換爲除Python中的名詞和形容詞之外的特殊字符串
- 24. 當一個單詞的同義詞與它的複數形式相同時:如何命名列表和實例?
- 25. 計算形容詞頻率的技巧
- 26. 通過斯坦福解析器提取所有名詞,形容詞形式和文本
- 27. 在RESTful URL中使用動詞和形容詞的替代方案
- 28. POS tagging - NLTK認爲名詞動詞
- 29. J,不易動詞動詞
- 30. Python正則表達式查找單詞與其他詞分開
嗯這樣的字典用例是什麼?也許把詞彙轉換成一個共同的根源是另一種選擇。如果沒有,你應該看看像[WordNet]這樣的數據庫(http://en.wikipedia.org/wiki/WordNet)。無論如何,這個問題可能太廣泛了。 – lukeA 2015-02-11 11:20:59
我不知道R綁定,但看到https://www.nodebox.net/code/index.php/Linguistics - verb.infinitive()/ present_participle() - 他們採取的方法記錄 – 2015-02-11 11:27:16
@Roland:可以一個OP接受對暫緩問題的回答? – lawyeR 2015-02-11 13:28:44