據我所知,幾乎所有的拼寫檢查都基於單個查詢詞,並且無法對整個輸入查詢進行更改以增加corpra中的覆蓋率。我有一個在lingpipe,但它是非常昂貴的... http://alias-i.com/lingpipe/demos/tutorial/querySpellChecker/read-me.html有沒有可以處理空格插入/刪除拼寫錯誤的lucene/solr拼寫檢查器?
所以我的問題什麼是最好的替代靈巧類似拼寫檢查的Apache的Apache?
據我所知,幾乎所有的拼寫檢查都基於單個查詢詞,並且無法對整個輸入查詢進行更改以增加corpra中的覆蓋率。我有一個在lingpipe,但它是非常昂貴的... http://alias-i.com/lingpipe/demos/tutorial/querySpellChecker/read-me.html有沒有可以處理空格插入/刪除拼寫錯誤的lucene/solr拼寫檢查器?
所以我的問題什麼是最好的替代靈巧類似拼寫檢查的Apache的Apache?
lucene中的拼寫檢查與其他任何字符一樣對待空格。所以一般來說,你可以爲他們提供你的查詢日誌或任何內容,並拼寫檢查/自動完成全部查詢。
對於Lucene的這應該只是工作,爲Solr的你需要確保QueryConverter不分割你的條件......看到https://issues.apache.org/jira/browse/SOLR-3143
在另一方面,這些suggesters目前整體上投入工作,所以如果您想要提出以前從未搜索過的查詢,則可以使用與http://googleblog.blogspot.com/2011/04/more-predictions-in-autocomplete.html類似的最後N個單詞。
我希望我們很快也會提供這種風格的建議作爲替代,可能在https://issues.apache.org/jira/browse/LUCENE-3842。
但請記住,這不適合所有目的,所以我認爲它可能只是一個選項。例如,如果您正在進行電子商務,則沒有意義建議您不銷售產品:)