0
我得到一個XML文件,其中充滿了來自法語的utf-8字符串。有些消息如下:UTF8編碼無法解碼
「N'oubliez PAS D'écrire樂NOM確切德樂professeur,SANS utiliser DES阿布拉©viations」
正如你所看到的,口音是失敗。我試圖用iconv轉換文件,但似乎沒有被識別爲UTF-8(當文件使用該字符集時)。我能做什麼?
謝謝!
我得到一個XML文件,其中充滿了來自法語的utf-8字符串。有些消息如下:UTF8編碼無法解碼
「N'oubliez PAS D'écrire樂NOM確切德樂professeur,SANS utiliser DES阿布拉©viations」
正如你所看到的,口音是失敗。我試圖用iconv轉換文件,但似乎沒有被識別爲UTF-8(當文件使用該字符集時)。我能做什麼?
謝謝!
嘗試在Windows記事本中打開該文件並查看它的外觀。如果看起來很好,那麼問題可能在其他地方(例如,您是否將數據發送到瀏覽器,而不是指定UTF-8?)。
如果它看起來錯在記事本太,試試下面的(我複製你的數據到一個文件,並能夠通過做這個「修復」的話):
這決賽F ile應該在記事本中正確打開,並使用三字節UTF-8簽名編碼爲UTF-8。
在解碼文件後,你還沒有說過你正在做什麼 - 例如,無論你是否顯示它(以及如何),將其轉換爲不同的編碼等。 – 2010-11-16 17:34:22
我敢打賭,這個文件使用ISO-8859-1編碼,所以使用這種編碼來正確讀取它。 – 2010-11-16 17:35:27
這看起來與UTF-8編碼的文件讀取到ANSI編碼的字符串完全相同。請閱讀指定正確字符集的文件... – 2010-11-16 17:57:19