3
我想在Solr中使用NGramFilterFactory(在Rails中使用太陽黑子)來查找相似的標題。我設法一個新字段添加到我的Solr schema.xml中像如下:使用Solr的NGramFilterFactory進行相似性搜索
<fieldType name="text_ngrm" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.NGramFilterFactory" minGramSize="2" maxGramSize="4"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
由於我在Rails應用程序中使用sunpsot,因此通過動態領域增加了新的領域,以黑子。這一切工作,我現在可以使用NGramFilterFactory搜索我的模型。我不確定的是,如何配置solr以搜索相似的標題。這裏是我的具體問題:
- 當我試圖查詢類似的標題時使用dismax查詢分析器是否有意義?
- (Minimum 'Should' Match)參數如何幫助我找到類似的標題?
- 根據什麼我會選擇ngram min。和最大。大小?
感謝您的任何反饋。