2016-09-23 121 views
0

我正在使用Lucene.Net(版本Lucene 3.0.3)。在搜索關鍵字「The」時, 當有大量匹配該關鍵字的記錄時,結果不會超過5個。 它適用於所有其他關鍵字。Lucene.Net無法搜索關鍵字「The」

是不是lucene有'The'的問題? :-)

+4

大多數人不希望搜索[停用詞(HTTP:// stackoverflow.com/questions/17527741/what-is-the-default-list-of-stopwords-used-in-lucenes-stopfilter)。如果你這樣做,你可以自定義它。 –

+1

這可能取決於您使用的分析儀。例如。您很有可能擁有[StopFilter](http://lucene.apache.org/core/4_0_0/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html)。 –

回答

0

正如評論中所述,您的問題是您正在使用的分析儀。

StandardAnalyzer可以處理與語法有關的各種事情,但也會刪除默認的一組英語停用詞(a,and,或then等),「the」就是其中之一。

您可以像

var a new StandardAnalyzer(version, new HashSet<string>()); 

創建它給它一個空的HashSet說:「沒有停止的話」