2015-02-11 196 views
1

我需要使用Stanford NLP工具對關於特定主題的新聞文章進行情感分析。句子級到文檔級情感分析。分析新聞

這樣的工具只允許基於句子的情感分析,而我想提取關於我的話題的整篇文章的情感評估。例如,如果我的話題是蘋果,我想知道關於蘋果的新聞文章的感受。

只是在我的文章中計算句子的平均值不會。舉例來說,我可能會有一篇文章說「蘋果公司非常擅長這一點,而這一點,儘管Google產品非常糟糕,但出於這些原因」。這樣的文章將導致使用平均句子分數的中性分類,而實際上這是一篇關於蘋果的非常積極的文章。

另一方面,將我的句子過濾爲只包含那些包含單詞的單詞蘋果會錯過「蘋果產品A非常好,但缺少以下關鍵功能:」的文章。在這種情況下,如果僅使用包含蘋果一詞的句子,則第二句的效果將會丟失。

有沒有解決這類問題的標準方法?斯坦福大學NLP是完成我的目標的錯誤工具嗎?

回答

3

更新:您可能想看看 http://blog.getprismatic.com/deeper-content-analysis-with-aspects/

這是研究的一個非常活躍的領域所以這將是很難找到一個現成的,現成的工具來做到這一點(至少沒有什麼是建於斯坦福大學CoreNLP)。一些指針:研究基於方面的情感分析。在這種情況下,蘋果將是一個「方面」(不是真的,但可以通過這種方式進行建模)。麻省大學的Andrew McCallum小組,劉易斯在UIC的團隊,康奈爾大學的NLP小組等都在研究這個問題。

如果您想快速解決問題,我會建議從參考Apple及其產品的句子中提取情感;使用coref(檢查斯坦福CoreNLP中的dcoref註釋器),這將增加句子的回憶並解決類似「但是它缺乏..」的句子問題。

+0

博客的鏈接未能加載我 – naoko 2016-08-03 20:31:36