2012-02-03 44 views
0

我已經安裝並配置了Solr,Tika並嘗試了索引和搜索文檔。到目前爲止,一切正常。但是,Unicode有一個問題(當然:))。我用一個關於Red Star(Црвеназвезда)足球俱樂部的Unicode文本索引了一個文檔。當我嘗試搜索這篇文章時,輸入「Црвена」或「звезда」Solr找到正確的文檔。Solr和Unicode

我如何創建這些詞(或其他西里爾詞)的同義詞列表?即使我輸入「звезде」,「звезду」等,爲了使Solr能夠查找文檔,我還需要做些什麼?

最佳, Joksimovic

回答

0

Solr的提供interface for synonyms以及一個SpellCheckComponent

但是,你的問題並沒有真正涉及到一個Unicode問題。

+0

謝謝你的回答。 我試圖將這些單詞添加在synonyms義詞.txt中,之後我無法找到我定義的同義詞。例如,我在此文件中放入了 「звезде」,「звезду」,「звездa」,而我甚至找不到「звезде」,這是我之前可以找到的。你也許知道什麼可能是一個問題? – Srecko 2012-02-03 17:09:46

+0

不帶引號並用','分隔。您是否還在模式中指定了synonymfilterfactory? – fyr 2012-02-03 18:30:30

+0

是的,沒有引號,並用a分隔。我認爲我指定了synonymfilterfactory,但目前我無法檢查......我不確定這一點。 – Srecko 2012-02-03 18:47:00