是否有任何現有的帶標記實體的數據集來訓練MITIE模型? 我檢查了鏈接,https://github.com/mit-nlp/MITIE/blob/master/examples/python/train_ner.py只用兩個樣本訓練模型。是否有任何現有的帶標記實體的數據集要訓練?數據集訓練MITIE模型
1
A
回答
2
我一直在尋找這樣的東西。只是爲了「通用」(因此不是非常有用的)NLU後端。到目前爲止,我發現的唯一一件事是一個訓練有素的模型,包含9個新聞類別(不是非常通用的)。請參閱此處的博客文章:http://eric-yuan.me/ner_1/
如果您可以選擇切換NER,那麼spaCy默認情況下會提供訓練有素的模型。它的可視化前端可以通過谷歌「displacy」找到
如果您發現任何其他問題,請告訴我!
編輯:花了一天看着這個,我想我已經找到了你在追求什麼。如果你去https://github.com/mit-nlp/MITIE/releases那裏,你會發現MITIE自己的NER模型在維基百科,Freebase等訓練。實際的訓練數據集也在那裏。他們的github頁面上的README提供了關於如何使用預先訓練的模型的示例。您還可以調查examples文件夾中的ner.py文件,以瞭解如何在Python代碼中使用預先訓練好的模型。
相關問題
- 1. 加速使用MITIE和Rasa的模型訓練
- 2. FANN訓練數據集
- 3. NLP模型訓練
- 4. TensorFlow:自定義圖像數據集上的訓練模型
- 5. 分割訓練數據以訓練n個模型的最佳數量
- 6. 重新訓練tensorflow模型
- 7. 如何訓練ML模型?
- 8. 訓練分類模型Opennlp
- 9. Keras訓練稀疏模型
- 10. 錯誤訓練im2txt模型
- 11. LightGBM:繼續訓練模型
- 12. SegNet - 訓練我自己的數據集
- 13. R glm()不包括訓練數據集
- 14. PyBrain:MemoryError:加載訓練數據集
- 15. 加載訓練有素的Keras模型並繼續訓練
- 16. 1)從整個訓練集中訓練CNN和2)訓練集中的訓練集,然後是整個訓練集之間的區別是什麼?
- 17. 使用大型數據集在Spark上訓練BloomFilter
- 18. 如何使用較小的數據集訓練Google Inception-v3模型?
- 19. 如何訓練像Mnist這樣的Libsvm數據集格式的naiveBayes模型?
- 20. 的R - 計算測試MSE給出從訓練集訓練模型和測試集
- 21. 在Matlab中訓練數據集,驗證數據集,測試數據集
- 22. 使用靜態訓練數據初始化StreamingKmeans模型
- 23. 將訓練數據添加到現有模型(bin文件)
- 24. 如何刪除派對::: ctree模型的訓練數據?
- 25. 當改變輸入數據時,Tensorflow模型沒有訓練
- 26. 使用訓練的高斯混合模型標記新數據
- 27. CNTK:訪問訓練過的模型數據
- 28. LSTM訓練模式
- 29. 意大利語Syntaxnet預訓練模型
- 30. CNTK python api - 繼續訓練模型
非常感謝。如果我找到其他有用的數據集,我會在這裏發表評論。 –
我嘗試通過聚集手套向量並使用名稱標記每個羣集來創建具有標記實體的自己的數據集。你認爲這是一個正確的方法嗎? –
聽起來很像,但我還沒有玩過這個東西,但還沒有確定。而且現在看起來我現在不會再回到這裏了,因爲我已經被分配到另一個項目了。你暫時獨立。對不起:( –