2017-06-01 62 views
0

我正在使用我正在爲自己的用例進行培訓的自定義模型。我的用例是根據它是否是地址變更請求來分類電子郵件。如果地址變更請求可以從一個句子中理解,它可以正常工作,沒有問題。但是,如果地址變更請求需要從多個句子中理解,則不起作用。 給予幾個例子如下: - 例1: - 這是工作一)培訓文件: -Apache Open NLP中的自定義模型

Guys I wish to <START:contactupdate> change my address <END> . 

我的新地址是68號賽特,考文垂,西米德蘭茲郡,CV1 4ED。 完成後請確認。 謝謝。

b)使用以下語句測試模型: - String input =「男士我希望更改我的地址。我的新地址是68 Dorset Road,Coventry,West Midlands,CV1 4ED.Please confirm your done。謝謝。」; //工作

  1. 示例2: - 這不起作用。 可以說地址變更請求只能從多行中推斷出來。

    「我的舊地址不再有效,需要更新它。」

如何在此場景中訓練我的模型?如何爲上述指定自定義標籤?

您能否請幫助。我被卡住了。 很多謝謝

回答

0

你是什麼意思與不工作?你想要檢索的東西沒有被檢索?或者當標籤分散在多行時,培訓會崩潰?

通常,您在此過程中訓練的(默認爲MaxEnt)模型會嘗試檢測您正在訓練的對象的常用特徵。通常情況下,這些名稱是人員,組織,地點等實體。並且在許多語言中,這些都包含典型的特徵(例如分別爲前綴Mr./M.,後綴,語素「街道」)。這可以通過模型拾取,並應用於新數據,從而識別您要識別的任何一個。然而,你正在嘗試做的事情是非常先進的NLP。由於詞組越長,可能的變化越大,挑選共性變得更加困難。我想說,對於你的用例,人們通常使用解析(或者選區或者依賴解析)或者其他更復雜的工具,而不僅僅是這種相對平坦的模式識別。所以你可能想要看看這些。我不知道您有多少數據可供您使用,從中您可以推斷出不同的方式來表達改變客戶數據庫中地址的願望。如果合理(即不只是幾個句子),您可能需要手動註釋它們,解析語料庫,在分析樹/圖上使用機器學習來獲取感興趣的句子,並以這種方式進行處理。如前所述,在我看來,相當先進的NLP,而不是一個開箱即用的解決方案。