2009-07-04 104 views
7

看起來最簡單,最天真的做基本情緒分析的方法是用貝葉斯分類器(通過我在這裏找到的證實證實)。任何反駁或其他建議?簡單的情緒分析

回答

11

貝葉斯分類器與一袋詞表示法是最簡單的統計方法。通過轉向更高級的分類器和特徵表示,您可以獲得更好的結果,但代價是更復雜。

統計方法不是鎮上唯一的遊戲。另一個主要選擇是基於規則的方法,對文本結構有更多的理解。從我所看到的,這些實際上並不像統計方法那麼好。

我推薦Manning和Schütze的統計自然語言處理基礎第16章,文本分類。

5

我想不出一種更簡單,更幼稚的方式進行情感分析,但是您可能會考慮使用支持向量機而不是樸素貝葉斯(在某些機器學習工具包中,這可能是一種直接替換) 。看一看"Thumbs up? Sentiment Classification using Machine Learning Techniques" by Bo Pang, Lillian Lee, and Shivakumar Vaithyanathan這是關於這些技術的最早的論文之一,並且給出了一系列相關技術的精確度結果的良好表格,但其中沒有一個比其他任何更復雜(從客戶角度來看)。

+0

這是一個不錯的開始。後來,彭和李又有一篇文章稍微有點不同,以獲得更好的結果。試試這個: http://www.aclweb.org/anthology-new/P/P04/P04-1035.pdf – mixdev 2010-07-02 09:56:04

1

大廈經上述肯提供的答案,還有另一篇論文

由託尼和尼日爾「支持向量機與不同的信息源情緒分析」,

看起來比它分配更多的功能彭和李使用的一袋字。在這裏,他們利用wordnet來確定形容詞的語義差異,並將文本中主題的情感接近度作爲SVM的附加特徵。它們比之前基於情緒分類文本的嘗試顯示出更好的結果。