Apache Open NLP中的自定義模型

我正在使用我正在爲自己的用例進行培訓的自定義模型。我的用例是根據它是否是地址變更請求來分類電子郵件。如果地址變更請求可以從一個句子中理解，它可以正常工作，沒有問題。但是，如果地址變更請求需要從多個句子中理解，則不起作用。給予幾個例子如下： - 例1： - 這是工作一）培訓文件： -Apache Open NLP中的自定義模型

Guys I wish to <START:contactupdate> change my address <END> .

我的新地址是68號賽特，考文垂，西米德蘭茲郡，CV1 4ED。完成後請確認。謝謝。

b）使用以下語句測試模型： - String input =「男士我希望更改我的地址。我的新地址是68 Dorset Road，Coventry，West Midlands，CV1 4ED.Please confirm your done。謝謝。」; //工作

示例2： - 這不起作用。可以說地址變更請求只能從多行中推斷出來。

「我的舊地址不再有效，需要更新它。」

如何在此場景中訓練我的模型？如何爲上述指定自定義標籤？

您能否請幫助。我被卡住了。很多謝謝

來源

2017-06-01 Kallol Chaudhuri

你是什麼意思與不工作？你想要檢索的東西沒有被檢索？或者當標籤分散在多行時，培訓會崩潰？

通常，您在此過程中訓練的（默認爲MaxEnt）模型會嘗試檢測您正在訓練的對象的常用特徵。通常情況下，這些名稱是人員，組織，地點等實體。並且在許多語言中，這些都包含典型的特徵（例如分別爲前綴Mr./M.，後綴，語素「街道」）。這可以通過模型拾取，並應用於新數據，從而識別您要識別的任何一個。然而，你正在嘗試做的事情是非常先進的NLP。由於詞組越長，可能的變化越大，挑選共性變得更加困難。我想說，對於你的用例，人們通常使用解析（或者選區或者依賴解析）或者其他更復雜的工具，而不僅僅是這種相對平坦的模式識別。所以你可能想要看看這些。我不知道您有多少數據可供您使用，從中您可以推斷出不同的方式來表達改變客戶數據庫中地址的願望。如果合理（即不只是幾個句子），您可能需要手動註釋它們，解析語料庫，在分析樹/圖上使用機器學習來獲取感興趣的句子，並以這種方式進行處理。如前所述，在我看來，相當先進的NLP，而不是一個開箱即用的解決方案。

來源

2017-06-20 14:32:25 Igor

Apache Open NLP中的自定義模型

回答

相關問題