2016-03-16 53 views

回答

0

NER解決方案傾向於特定於域,使用硬編碼的字列表作爲信號(特徵)和/或命名實體的內部字母結構。

英國/美國的名稱與其他歐洲名稱相似,因爲很多流行的美國名字和姓氏都來自非英語的歐洲移民。印度人的名字顯着不同,常用的名字/姓氏和訓練數據語料庫清單通常不包含太多或任何印度特有的數據。

要解決您的問題,您需要根據適合您特定域的數據來訓練專門的NER模型。

+0

是否有任何其他選擇認可的印度名稱實體?喜歡其他開源工具等。@peteris –

相關問題