2011-03-23 97 views
1


我有新聞存儲與1,000,000條記錄我使用lucene庫全文搜索我的新聞hast(標題,正文,新聞日期,...)我需要找到最佳查詢尋找從用戶輸入最相關的結果我應該使用什麼策略或算法來實現這個用戶搜索輸入的最佳lucene查詢

現在即時通訊使用這樣的事情(title^3.0 body^2.0)但我認爲它簡單我正在尋找更復雜的算法來獲取更相關的結果。

我真的很感激,如果你幫我發現我的溢出朋友!

回答

0

提高搜索相關性需要時間和迭代細化。

的LucidImagination團隊有很好的寫了(非常的Solr雖然爲基礎): http://www.lucidimagination.com/Community/Hear-from-the-Experts/Articles/Search-Application-Relevance-Issues

您可能要分析日誌,並添加每個文檔的瀏覽量到您的索引,以便您可以因素,在你的排序順序。

只要捕捉到震級變化,數字不一定非常準確。

您還應該分析錯誤拼寫的日誌。 lucidimagination傢伙有一些關於索引他們的播客或博客。