0
我試圖將LetterTokenizerFactory
與WhitespaceTokenizerFactory
組合起來,並且無法找到如何使用copyField
複製內容的方法。在Solr中組合多個標記器
讓我描述了我的想法:
- 我在文字,例如兩個條目^ h & M和惠普
- 用戶應該能夠找到^ h &中號進入
h&m
- 我用WhitespaceTokenizerFactory
爲了這個目的,無需特殊字符分割令牌 - 用戶應該能夠找到惠普進入「惠普」 -
LetterTokenizerFactory
供應這種情況下,令牌分裂特殊字符 - 現在我想結合了該斷詞
我怎麼能實現它不宣而2種不同類型具有不同的標記生成器工廠,然後複製值至 第二種類型的字段?
謝謝,它可以工作!但我希望能找到一種方法,即使我沒有指定任何特殊的符號,也總是有特殊字符的額外原始標記。例如「熱點」 - >「熱點」,「點」,「熱點」; 「h&m」 - >「h」,「m」,「h&m」等。 – bsiamionau
我剛纔注意到'preserveOriginal'選項保留原始值作爲標記 – bsiamionau