2017-09-05 62 views
1

我想訓練一個模型中使用opennlp分類鳴叫。我的問題是我應該在用於訓練模型的tweets上執行標記化,停止單詞刪除等操作,還是應該直接使用tweet而不執行消毒處理?NLP分類培養模式

+0

什麼你的模型正試圖完成? – TrnKh

回答

0

這真的取決於你是什麼樣的培訓:

  • 如果你的算法旨在收到簡單的文本,並將其使用在其上的機器學習技術之前執行自身所有的簡化你應該提供對的鍵入
  • 否則,如果你只是trianing一個黑盒子,我會說,如果你的模型是要在特定類型的功能的工作,你的情況記號化和朵朵字應該對這種類型的數據進行培訓,以提供