我正在邁出ML的第一步,特別是用於文本情感分析的分類器。我的方法是製作通常的80%訓練數據集和20%的測試。有一個訓練有素的模型什麼是出現新特徵時在生產環境中進行的最佳方式(初始數據集中不存在文本中的新詞)?處理分類模型中的新功能
0
A
回答
0
在分類任務中,必須在列車時間看到所有的特徵,並且以後不能將新特徵添加到預測階段。爲了您的問題,您可以使用Stemming或Lemmatizing。或類似的東西LDA或Word2Vec有大量的文檔他們訓練
這一章可能是有用的:https://nlp.stanford.edu/IR-book/html/htmledition/stemming-and-lemmatization-1.html
0
是你所描述的通常被稱爲「出來的詞彙」問題(OOV)出現在詞測試集,但不在訓練集中。傳統的方法是用一個特殊的標記(例如「UNKNOWN」)表示每個OOV詞,並且實際上在訓練數據中包含這些詞。在Jurafsky和Martin的「語音和語言處理」的Section 4.3中更全面地討論了這種方法。
更現代的方法是使用Word2Vec。這是在神經網絡中發現的真正的advanced topic。
相關問題
- 1. 在功能接受基本類型中處理der types類型
- 2. 理解階類型功能
- 3. 部分功能的F#異常處理
- 4. 處理包裝類的功能
- 5. Ajax能否成功()處理兩種類型的返回?
- 6. 模式維基類型功能模式
- 7. 模板類類型特定功能
- 8. 在部分和空模型值中處理空模型
- 9. 預處理功能
- 10. RandomForestRegressor功能處理爲類別?
- 11. 類型處理
- 12. 分配正確的類型來重新選擇createSelector功能
- 13. 最新的hibernate(5)能處理數組類型嗎?
- 14. 如何在另一個模型類中調用一個模型類的功能?
- 15. 水銀分支模型任務功能
- 16. 對模型功能分頁結果
- 17. 模板功能:基於類型名稱
- 18. 功能領域odoo類型float,新api
- 19. WordPress分頁不能處理自定義文章類型和分類術語
- 20. 處理Django模型
- 21. 處理中的間隔運行功能
- 22. 類型和功能
- 23. 預處理多值功能?
- 24. 批處理功能同步?
- 25. Python多處理功能
- 26. 處理功能鍵按
- 27. 功能處理在MATLAB
- 28. 如何在sklearn.svm.libsvm.fit()分類器中包含列表類型功能?
- 29. 創建新類型時如何處理多個對象類型
- 30. 如何處理可能擁有或借用的FFI未分類類型?