2011-09-22 73 views
2

我仍然是一個Solr Lucene的新手,我注意到一個有趣的「問題」與我執行的搜索。Solr lucene和「類似」的關鍵詞

如果我對「響應」進行基本搜索,我還會得到包含「負責」一詞的結果。

我想這是好的,但問題是與我一直在尋找關鍵字(響應)的結果出現在下面的結果,包含我沒有找的關鍵字! (負責)。當然,與「負責任」的結果有更多的關鍵字匹配,但事實仍然是我沒有搜索到這一點。

我喜歡這個替代詞/同義詞功能,但有一個設置,我應該尋找以確保實際搜索關鍵字的結果排名高於替代品?

很多在此先感謝,非常感謝。 Seb

+0

不得不提一提:stemmer發現有機體和組織的根源。 – aitchnyu

回答

3

你在這個領域的詞幹似乎是對相同的根負責任的響應&。
Solr沒有超出實際比賽的排名。

如果您希望實際搜索詞的排名高於替代詞,您需要同時保留詞幹的和非詞幹的版本,並且爲未定版的版本添加比詞幹版本更多的權重。

+0

聽起來很有趣。像我這樣的新手如何實現這一目標? – seb835

+0

將嘗試提供一些信息。其他選擇是根本不使用阻塞或使用較不積極的干擾源(可用於solr),這將不會產生如上所述的不可預測的結果。 – Jayendra

+0

添加了一些細節 - http://stackoverflow.com/questions/7722649/boost-result-by-specified-search-term-on-top/7723231#7723231 – Jayendra

0

它使用哪個排名算法?您必須修改排名算法函數。