2015-12-13 46 views
0

我想製作一個搜索系統。我使用的是Lucene,它就像快速的gonzales。但我有一個問題。當我使用土耳其字符(ç,ş,ü,ö,ı)時,Lucene不會返回任何結果。但是當我用我的文字使用非土耳其字符時,Lucene會返回結果。Lucene和土耳其字符

我該如何解決這個問題?

回答

1

你可能想看看FoldingFilter和分析儀的。當將它們保存到索引時,Lucene可能會將非ASCII字符轉換爲ascii。

不知道你使用的是什麼版本的Lucene,可能有助於搞清楚發生了什麼。

+0

嗨,尼克,謝謝你的回覆。我使用Lucene 3.0.1。 –

+0

你有沒有用Luke來看看這些文件是如何存儲的?這將幫助您確定文本是如何存儲的,或者查詢文本如何被修改,這是問題所在。 此外,當前保存什麼分析儀?你只是使用StandardTokenizer和StandardAnalyzer? – Nick

+0

我下載了Luke並運行它。再次,我運行測試查詢與土耳其字符,但不返回任何結果...此外,我使用SimpleAnalyzer。 –