最近我一直在閱讀NLP,到目前爲止,我已經得到了一個從句子拆分到POS標籤的各種工作原理的基本概念(非常) ,還有知識表示。NLP /任務。回答 - 從數據庫中檢索信息
據我所知,有很多NLP庫(主要是Java或Python),並且已經找到了.NET實現(SharpNLP)。實際上它很棒。無需編寫任何自定義處理邏輯;只是使用他們的功能和瞧!用戶輸入是很好的分離和POS標記。
如果我的主要動機是建立一個問題回答系統(類似於聊天機器人),我不明白的是從這裏開始。哪些庫(最好是.NET)可供我使用?如果我想構建自己的知識庫,我該如何表達自己的知識?我是否需要將POS標記的輸入解析爲我的數據庫可以理解的其他內容?如果我使用MS SQL,是否有任何庫可以幫助將POS標記的輸入映射到數據庫查詢?或者我需要寫我自己的數據庫查詢邏輯,根據程序語義(我讀過)?
當然,下一步是制定一個結構良好的答覆,但我認爲我可以稍後離開。現在什麼是我在這方面的資源缺乏(知識表示,NLP到KB/DB檢索),我真的很感激,如果你們任何人都可以爲我提供你的專業知識:)
哈哈,我很高興你真的試了一下,所以至少我知道我應該朝哪個方向發展努力。對我而言,你所談論的所有NLP內容似乎都很熟悉(我一直在閱讀James Allen的自然語言理解),但是你對「真正的困難」的理解 - 真的讓我覺得很懊惱。我猜這就意味着目前的規範是以句子和陳述的形式存儲知識/事實,而不是任何其他形式的知識表示,你呢?你聽起來對整個問題答疑主題都非常瞭解。你到目前爲止如何? – matt 2013-02-20 16:08:25
@matt雖然我已經在各種特定領域的環境中實現了一些「NLP管道」,但我依然在通過大部分NLP和相關技術實現BS。不要被我顯然權威的風格所迷惑;-)另外,這裏描述的「事實」(與主語,動詞和賓語一樣是短語)僅僅是存儲知識的常用方便方式,可能特別適用於語義搜索和紅外線應用程序;然而,他們並不是你猜測的「當前規範」。例如,它們比語義網絡更簡單(但也更有限)。 – mjv 2013-02-21 06:47:18
「語義網絡」有許多不同的「風味」,它們本身就是知識表示的另一種形式,也很流行,但也可能不是「規範」。事實上,可能沒有任何規範,但只是一些概念格式,其衆多的實現和支持語言。 NLP騎師的任務是選擇一個適合手頭任務的人(並且與整體架構非常吻合)。 – mjv 2013-02-21 06:55:04