我正在尋找一些未曾使用的新數據源來訓練一個樸素的貝葉斯。我已經看過IMDB評論的Pang語料庫和MPQA意見語料庫的Lee &。我正在尋找符合以下標準的新Web服務。分類情感數據的來源?
- 容易分類 - 必須有一個喜歡/不喜歡或5星評級
- 隨時可
- 涉及到新材料
這裏(比前兩個不太重要的)是一些樣品我自己想出了。
- Etsy的API
- 爛番茄API
- Yelp的API
任何其他建議,將不勝感激=)
我正在尋找一些未曾使用的新數據源來訓練一個樸素的貝葉斯。我已經看過IMDB評論的Pang語料庫和MPQA意見語料庫的Lee &。我正在尋找符合以下標準的新Web服務。分類情感數據的來源?
這裏(比前兩個不太重要的)是一些樣品我自己想出了。
任何其他建議,將不勝感激=)
在龐&李的後期工作(2008年),「意見挖掘和情感分析「here他們有一個公開的資源部分。它與這些語料庫有聯繫。
看看sentiment140。它有一個你可以下載和訓練的語料庫。您可以輕鬆擴展到新的推文。
[情感分析的培訓數據]的可能重複(http://stackoverflow.com/questions/7551262/training-data-for-sentiment-analysis) – 2012-02-16 10:03:48