2011-03-17 137 views
1

我正在處理一個html文件..我用html清理器來清理html文件,然後格式發生了變化(所有'e's都被替換爲+)...我怎樣才能改正java中的問題UTF8編碼問題

+2

這是奇怪的,因爲即使你撰寫這兩個ASCII字符'+®'作爲單個Unicode字符('0x2BAE')這是一個未分配的Unicode碼點。而'e'在ASCII和UTF8中是相同的。想知道它可能試圖從哪個編碼轉換爲? – 2011-03-17 15:56:43

回答

1

在你正在做的事上發佈一些代碼。這裏是一個答案,我到了一個類似question

FileInputStream fis = new FileInputStream("filename"); 
BufferedReader reader = new BufferedReader(new InputStreamReader(fis, "UTF-16"));