2014-11-22 111 views
1

我從不同的博客文章中刪除關於特定主題的文本。我閱讀的關於sentimenet分析的大部分主題都是基於對分類器的訓練,以便決定它是否爲pos/neg答案,如thread中所示。 我的問題是我可以在哪裏找到字典詞典,並有情緒。 例如:Nice: Positive , bad: negativenltk NaiveBayesClassifier培訓博客情緒分析

回答

3

你在找什麼是情感詞典。情感詞典是一個單詞詞典,其中每個單詞都有相應的情感評分(範圍從非常負面到非常正面),或者像你提到的標籤,如好或壞(但後者不常見)。有幾種你可以使用的情感詞典,比如sentiwordnet,sentistrength和AFINN等等。在所有這三個詞彙中,你都會得到與每個情感詞相對應的情感分數,當然,你可以簡單地設定一個條件,即如果一個詞有相應的負分,那麼它的不好,如果是好的,則它是好的。 其中最容易使用的是AFINN,我建議您首先使用。稍後,您可以根據您的應用程序升級到更合適的一個。 您可以找到有關AFINN here的信息,從here下載。

讓我知道你是否還有其他問題。