我是新來的ML/NLP領域,所以我的問題是,什麼樣的技術是最合適的,以實現以下目標:使用NLP或機器學習來提取關鍵字把句子
我們有一個簡短的句子 - 「去哪裏吃晚飯?」或「你最喜歡的酒吧是什麼?」或者「你最喜歡的便宜酒吧是什麼?」
是否有這將使我訓練它提供以下數據集的技術:
- 「去哪裏吃飯?」 - >晚餐
- 「你最喜歡的酒吧是什麼?」 - >酒吧
- 「你最喜歡的便宜餐廳是什麼?」 - >廉價,餐廳
這樣下一次我們有一個類似的問題關於一個未知的活動,比如說:「你最喜歡什麼昂貴的[無論]」它將能夠提取「昂貴」和[無論] ?
的目標是,如果我們可以用這個問題的數百變化(或上千)訓練它要求及相關的輸出數據預期,因此它可以與日常用語的工作。
我知道如何使它即使沒有NLP/ML,如果我們有像酒吧,餐廳,游泳池等,預計術語詞典,但我們也希望它與未知項工作。
我已經看到了耙和Scikit學習爲「東西」分類的例子,但我不知道我會怎麼養活文本到這些,所有這些例子有培訓預定義的輸出。
我也試了谷歌的NLP API,亞馬遜Lex和機智,看看他們在提取實體有多好,但結果令人失望,至少可以說。
閱讀有關摘要技術,我留下的印象是它不適用於小型單句文本,所以我沒有深入研究它。
如果您的輸入與您的示例一樣短,只是提取所有形容詞和名詞似乎就足夠了。有什麼理由不適合你嗎? – polm23