2012-08-08 143 views
-1

我正在捲曲網站並將其寫入.json文件;這個文件被輸入到我的java代碼中,該代碼使用json庫來解析它,並將必要的數據寫回到一個CSV文件中,我以後使用它將它存儲在數據庫中。解析json數據時出現錯誤的文本編碼

正如你所知道的數據從網站未來可以在不同的格式,所以我相信,我閱讀和UTF-8格式寫的,我仍然得到錯誤的輸出。

例如,Østerriksk變得�sterriksk

我正在Linux中完成所有這些工作。我認爲有一些編碼問題,因爲相同的代碼在Windows中運行良好,但不在Unix/Linux中運行。

我敢肯定我的java代碼是正確的,但我無法找出什麼我做錯了。

您正在使用什麼樣的IDE,例如這可以,如果你使用的是Eclipse IDE發生,而不是設置默認編碼的性能UTF-8
+0

我應該改變我的方法來從shell解析json文件而不是java程序嗎?如果是這樣,請在那裏指導我.. – 2012-08-08 11:07:33

回答

0

您正在閱讀的數據爲ISO 8859-1但文件實際上是UTF-8。我認爲文件讀取器有一個參數(或設置)可以解決這個問題。

另外:捲曲是不會在意的編碼。這在Java代碼中確實是錯誤的。

+0

非常感謝回覆。我所要做的只是在ISO 8859-1中讀取並將其寫入utf-8中。 – 2012-08-23 10:45:49

0

+0

我正在使用Eclipse Hellios。 – 2012-08-23 10:53:03