Q

如何做solr使用單個分詞器的多語言搜索

2017-01-23 169 views 0 likes

0

大家好，我想用單個詞法分析器開發所有語言的多語言搜索。有可能在單核中開發，所有語言。如何做solr使用單個分詞器的多語言搜索

2017-01-23 Pallav Jha

+0

我們在談論哪些語言？ ICUTokenizer可以配置爲大多數需要特殊行爲的語言（常規UTF斷點不會自行切斷）。這就是說 - 標記器通常不是在單個字段中具有多種語言的問題，而是標準化，排序和適當的詞幹等。 – MatsLindh

A

回答

0

我認爲沒有必要爲每種語言分別設置分詞器。

我有一個字段類型，用於德語，法語，波蘭語和英語語言。不同語言的數據/內容存儲在同一個內核中並得到支持。

我認爲這也適用於你。

您是否在尋找其中提到的其他語言？

2017-01-23 12:39:46

+0

我想用相同的tokenizer搜索所有語言。是否有可能在solr？ –

+0

是的......它可能... –

+0

你可以請給我一些想法如何做到這一點？ –

相關問題