2015-03-02 62 views
0

我是新使用Solr工作,我有我的服務器正常運行的實例如何讓Solr在查詢中不索引常用單詞?

我的問題是:

當我查詢Solr的一些方面,它沒有返回結果,但也有項目該術語索引。我和一位正在使用這個Solr實例的開發人員進行了交談,他記得關於「黑名單」或「空列表」或其他相關內容的某些東西,這些東西充當查詢的過濾器,就像一個常見的單詞列表,返回質量差結果到一個查詢,如: 「a」,「the」,「for」,...

我想知道如何管理該列表以從中刪除術語(或添加一個,編輯,等等)

回答

1

這聽起來像你在說停用詞過濾器。如果您有詞過濾活躍,你應該會看到類似這樣的東西在你的領域分析中schema.xml

<filter class="solr.StopFilterFactory" ignoreCase="true" 
       words="stopwords.txt" enablePositionIncrements="true" /> 

此引用文件stopwords.txt,這是該文件的標準名稱,但也可以使用不同的文件名,所以它可能會在你的服務器上有所不同。該文件將包含在搜索過程中應忽略的單詞列表。您應該在索引conf目錄中找到此文件(與schema.xmlsolrconfig.xml相同)。您可以編輯此文件,但爲了獲得最佳效果,您應該在完成後重新爲您的記錄編制索引。或者,如果您不希望過濾搜索中的常用單詞,則可以從字段分析中完全刪除對StopFilterFactory的引用。同樣,您應該計劃在完成後重新編制記錄。

+0

太棒了,它的工作原理! – Oriam 2015-03-02 20:56:37