2011-05-18 101 views
0

我正在製作一個(自我配置的)知識引擎,用戶輸入一個問題並在線搜索百科全書,然後返回一個簡單的答案。如何使用PHP將查詢分解爲詞類,從而可以確定問題的主題?舉個例子,舉個例子,問題是「誰是英國首相?」顯然,誰是代名詞,是否是助動詞,是否是一篇文章(因此可能會被忽略,句子仍然有意義),而英國首相將是我認爲的主要疑問。感謝您的幫助!PHP查詢分析

回答

0

你應該看看POS標記(詞性),谷歌它。 一個這樣的惡搞是斯坦福NLP惡搞(自然語言處理組) http://nlp.stanford.edu/software/tagger.shtml

+0

謝謝!欣賞它 – Matt 2011-05-18 02:24:09

+0

謝菲爾德大學有一個很好的NLP工具包。 http://gate.ac.uk/ – Satish 2011-05-18 02:24:34

0

這是不是真的那麼難,你正在做的信息查詢,不發出命令,從頭開始做。他們的關鍵在於恰當地分解這個詞。

確定是否存在疑問代詞(在您的示例中爲「who」),它將出現在句子的開頭。不要把它和一個關係代詞混淆起來,而這個關係代詞會在以後出現。從查詢中提取出來,並將其用作二階精煉器。

這個問題是英國首相,這是你做你的核心搜索,使用疑問作爲子選手(誰,什麼,在哪裏等)。

如果有一個關係代詞,可以用作二階選擇器或分組在主選擇器中。

您只需轉儲文章等停用詞。