1

我正在尋找一些未曾使用的新數據源來訓練一個樸素的貝葉斯。我已經看過IMDB評論的Pang語料庫和MPQA意見語料庫的Lee &。我正在尋找符合以下標準的新Web服務。分類情感數據的來源?

  1. 容易分類 - 必須有一個喜歡/不喜歡或5星評級
  2. 隨時可
  3. 涉及到新材料

這裏(比前兩個不太重要的)是一些樣品我自己想出了。

  • Etsy的API
  • 爛番茄API
  • Yelp的API

任何其他建議,將不勝感激=)

+0

[情感分析的培訓數據]的可能重複(http://stackoverflow.com/questions/7551262/training-data-for-sentiment-analysis) – 2012-02-16 10:03:48

回答

1

在龐&李的後期工作(2008年),「意見挖掘和情感分析「here他們有一個公開的資源部分。它與這些語料庫有聯繫。

1

看看sentiment140。它有一個你可以下載和訓練的語料庫。您可以輕鬆擴展到新的推文。