2017-01-23 169 views
0

大家好, 我想用單個詞法分析器開發所有語言的多語言搜索。有可能在單核中開發,所有語言。如何做solr使用單個分詞器的多語言搜索

+0

我們在談論哪些語言? ICUTokenizer可以配置爲大多數需要特殊行爲的語言(常規UTF斷點不會自行切斷)。這就是說 - 標記器通常不是在單個字段中具有多種語言的問題,而是標準化,排序和適當的詞幹等。 – MatsLindh

回答

0

我認爲沒有必要爲每種語言分別設置分詞器。

我有一個字段類型,用於德語,法語,波蘭語和英語語言。不同語言的數據/內容存儲在同一個內核中並得到支持。

我認爲這也適用於你。

您是否在尋找其中提到的其他語言?

+0

我想用相同的tokenizer搜索所有語言。是否有可能在solr? –

+0

是的......它可能... –

+0

你可以請給我一些想法如何做到這一點? –