我一直在探索NLP技術,目標是確定調查評論的主題(然後將其與情感分析結合使用)。我想做出高水平的表述,例如「10%的受訪者對客戶經理做出了積極的評論(+觀點)」。識別潛在客體
我的方法使用了Named Entity Recognition (NER)。現在我正在處理真實數據,現在我可以看到與識別句子主題相關的複雜性&。這裏有5個例子,其中主題是客戶經理。出於演示目的,我已將該命名實體加粗。
- 我們客戶經理是偉大的,他總是會多哩!
- Steve我們的客戶經理是偉大的,他總是走得更遠!
- 史蒂夫我們的關係經理是偉大的,他總是去額外 英里!
- 史蒂芬是偉大的,他總是走得更遠!
- 史蒂夫史密斯是偉大的,他總是走得更遠!
- 我們的business mgr。是偉大的,他總是走得更遠!
我看到我的任務
- 增加了複雜性同義詞三個挑戰:客戶經理VS關係經理VS業務經理。這在某種程度上是特定領域的,並且隨着調查對象的不同而不同。
- 縮略語:經理。 vs manager
- 歧義 - 無論「史蒂文」是「史蒂夫史密斯」&因此 「帳戶經理」。
這些同義詞問題是最常見的問題,其次是歧義問題。根據我所看到的,縮寫問題在我的數據中並不常見。
是否有任何NLP技術可以幫助處理這些問題的相對高度的自信?
你能解釋一下你究竟想要達到什麼目的嗎?對於你的6個例子,你想實現的方法的輸出是什麼? – Tobias
所有六個句子都被分類/識別爲具有相同的主題 - 「客戶經理」。目前使用NER,句子1和2具有「客戶經理」的主題,而3是「關係經理」,並且6是業務經理。同樣,第5句以史蒂夫史密斯(一位客戶經理)爲主題。所以本質上我試圖提煉出這個句子來確定根本主題。這種蒸餾的目標是使分析更容易。 – Steve