4

我CSE畢業設計,我選擇是搜索引擎的模擬使用情感分析來評估的意見/評論是否是正/負/中性情感分析

我不知道我怎麼會是儘管如此,但我明白它使用了先訓練的分類代理,然後它可以自行分類。邊緣不高(約60%,我明白)

我的問題是,這將工作在非英語語言?我的意思是我想對阿拉伯評論/評論進行情緒分析,併產生適當的情緒,這對目前的分類器是否可行?如果不是,我需要編寫自己的分類器,是否可以編寫自定義分類器?

回答

7

我的問題是,這將工作在非英語語言?我的意思是我想對阿拉伯評論/評論進行情緒分析,併產生適當的情緒,這對目前的分類器是否可行?

你在這裏混淆了一些東西。你稱之爲「分類代理」,正確地稱爲學習者。學習者參加訓練集以產生分類器。這可以應用於看不見的數據以獲得積極/消極/中立的分類。

爲了使這種機器學習的NLP任務適應新的語言,您需要一個數據集來訓練。大多數情感分析工具都需要一個標記集合,這個集合可能很昂貴而且難以實現,所以我建議你查看this answer中概述的無監督方法(無監督=從未標記的數據中學習)。該方法是用英語描述的,但我聽說其他語言已經取得了合理的結果。 YMMV,但是,基於您要使用的確切數據集。

0

有一個想法可以根據youtube數據對評論進行情感分析。

請注意,YouTube上有一個喜歡/不喜歡的系統,因此您可以使用視頻中的喜歡/不喜歡比例爲其下面的評論指定一些正面/負面的值。

另外,您可以通過gdata API訪問數據。而且這種方法是獨立於語言的,您只需分析以選定語言發佈的視頻。

0

我的公司(Repustate.com)最近通過我們的API爲阿拉伯語添加了情感分析。使用API​​並不是免費的,但你可以嘗試一個免費的在線演示,看它是否符合你的需求。這是一個link to the free demo