我想從一個文本NGramFilterFactory不能正常工作
提取關鍵詞例如,如果nameEn =「大家好今天」,我做的關鍵字搜索「身體」它讓我看到結果
我用註釋AnalyzerDef,但我有我的代碼有問題
我會解釋這個問題:
nameEn =「大家好今天」
例如,當我搜索「B」,它讓我看到結果
但是,當我搜索「博」,「董事會」或「身體」,它顯示了我什麼
現在,當我改變minGramSize 2
當我搜索「微博」,它讓我看到結果
而其他關鍵詞「b」,「董事會」,「身體」它讓我看到什麼
我做不知道問題究竟在哪裏,因爲根據下面的代碼,當我進入紅色的 「博」
輸出將是: 「B」, 「博」
@Indexed
@AnalyzerDef(name = "autocompleteNGramAnalyzer", tokenizer =
@TokenizerDef(factory = StandardTokenizerFactory.class), filters = {
@TokenFilterDef(factory = WordDelimiterFilterFactory.class),
@TokenFilterDef(factory = LowerCaseFilterFactory.class),
@TokenFilterDef(factory = NGramFilterFactory.class, params = {
@Parameter(name = "minGramSize", value = "1"),
@Parameter(name = "maxGramSize", value = "50") }),
@TokenFilterDef(factory = PatternReplaceFilterFactory.class, params = {
@Parameter(name = "pattern", value = "([^a-zA-Z0-9\\.])"),
@Parameter(name = "replacement", value = " "), @Parameter(name = "replace", value = "all") }) })
@Analyzer(definition = "autocompleteNGramAnalyzer")
public class Product implements Serializable {
@Field(index = Index.YES, analyze = Analyze.YES, store = Store.NO)
private String nameEn;
的搜索方法:
public List<Product> searchProduct(String keyWord) {
FullTextSession fullTextSession = Search.getFullTextSession(getSession());
try {
fullTextSession.createIndexer().startAndWait();
} catch (InterruptedException e) {
e.printStackTrace();
}
QueryBuilder queryBuilder = fullTextSession.getSearchFactory().buildQueryBuilder().forEntity(Product.class).get();
org.apache.lucene.search.Query luceneQuery = queryBuilder.phrase().withSlop(2).onField("nameEn").boostedTo(5).sentence(keyWord.toLowerCase()).createQuery();
org.hibernate.Query fullTextQuery = fullTextSession.createFullTextQuery(luceneQuery, Product.class);
List<Product> result = fullTextQuery.list();
return result;
}
任何幫助表示讚賞
我用同樣的例子,但是當我用EdgeNGramTokenFilter.class它表明我這個錯誤:類型不匹配:不能從類轉換到類<?擴展TokenFilterFactory> –
@AymenKanzari對,在例子中出現了一個錯字:EdgeNGramTokenFilter.class應該是EdgeNGramTokenFilterFactory.class。我修正了這個例子。 –
注意:沒有EdgeNGramTokenFilterFactory.class,有EdgeNGramFilterFactory.class。我也有同樣的問題。例如: nameEn = [Juno Taylor,Tom Caner Junior,Alan Smith,John Cane,這款休閒襯衫有一個普通領子...]。 'jun'返回Juno Taylor和Tom Caner Junior, 'an'應該會返回Alan Smith,John Cane,Tom Caner Junior和這款休閒襯衫有一箇中國領......但它不會返回 'a'或' n'應該全部返回,但它什麼都不返回 –