2017-10-06 427 views

回答

2

我一直在尋找這樣的東西。只是爲了「通用」(因此不是非常有用的)NLU後端。到目前爲止,我發現的唯一一件事是一個訓練有素的模型,包含9個新聞類別(不是非常通用的)。請參閱此處的博客文章:http://eric-yuan.me/ner_1/

如果您可以選擇切換NER,那麼spaCy默認情況下會提供訓練有素的模型。它的可視化前端可以通過谷歌「displacy」找到

如果您發現任何其他問題,請告訴我!

編輯:花了一天看着這個,我想我已經找到了你在追求什麼。如果你去https://github.com/mit-nlp/MITIE/releases那裏,你會發現MITIE自己的NER模型在維基百科,Freebase等訓練。實際的訓練數據集也在那裏。他們的github頁面上的README提供了關於如何使用預先訓練的模型的示例。您還可以調查examples文件夾中的ner.py文件,以瞭解如何在Python代碼中使用預先訓練好的模型。

+0

非常感謝。如果我找到其他有用的數據集,我會在這裏發表評論。 –

+0

我嘗試通過聚集手套向量並使用名稱標記每個羣集來創建具有標記實體的自己的數據集。你認爲這是一個正確的方法嗎? –

+0

聽起來很像,但我還沒有玩過這個東西,但還沒有確定。而且現在看起來我現在不會再回到這裏了,因爲我已經被分配到另一個項目了。你暫時獨立。對不起:( –