2011-08-25 39 views
4

我正在使用solrj 1.4。我的solrj沒有正確編制UTF-16編碼文件。我猜想當它試圖轉換爲unicode時,它用unicode可替換字符U + FFFD替換有問題的utf-16替代鍵。任何人都可以指導我如何配置solrj 1.4索引/搜索utf-16文件以及utf-8?Solr vs文檔編碼問題

回答

1

Solr索引是utf-8(Why don't International Characters Work)。爲了能夠使用其他編碼進行搜索,您始終可以在軟件接口Solr中執行翻譯。

+0

從utf-16到utf-8的轉換始終100%成功。有沒有可用的傻瓜證明方法或API? – user911084

+0

傻瓜證明我不知道,但[CharsetEncoder](http://download.oracle.com/javase/6/docs/api/java/nio/charset/CharsetEncoder.html)通常很方便。 –