我其中我想匹配這樣的情況:Solr的最小匹配定製
查詢:ABCD EFGH IJKL MNOP
這個查詢進行的ngram標記生成器,並且每個字被分成後2克令牌。
如)中的查詢分成,
AB,BC,CD,EF,FG,GH,IJ,JK,KL,MN,不,運
現在同時匹配我想要的用詞語來定製用於標記的最小匹配。
我的意思是,默認情況下,當某個單詞對應的單詞與索引文檔相匹配時,mm = 1,則返回該索引文檔。如果我給mm = 2,那麼來自任何兩個單詞的任何一個標記都需要匹配要被返回的索引文檔。
但我想要的是:只有當任何「m」個令牌都匹配mm = num個詞時才返回一個文檔。
例如)我想從至少3個單詞中選擇至少2個標記來選擇索引文檔。
看來Lucene的IndexSearcher完成了這個核心部分。我是否需要更改代碼或任何其他配置來執行上述操作?
在此先感謝...
太好了。我之前聽說過萊文斯坦的距離。感謝您寶貴的建議。我會仔細看看的。 – sriram 2012-04-19 16:38:52