2010-11-16 135 views
0

我得到一個XML文件,其中充滿了來自法語的utf-8字符串。有些消息如下:UTF8編碼無法解碼

「N'oubliez PAS D'écrire樂NOM確切德樂professeur,SANS utiliser DES阿布拉©viations」

正如你所看到的,口音是失敗。我試圖用iconv轉換文件,但似乎沒有被識別爲UTF-8(當文件使用該字符集時)。我能做什麼?

謝謝!

+0

在解碼文件後,你還沒有說過你正在做什麼 - 例如,無論你是否顯示它(以及如何),將其轉換爲不同的編碼等。 – 2010-11-16 17:34:22

+1

我敢打賭,這個文件使用ISO-8859-1編碼,所以使用這種編碼來正確讀取它。 – 2010-11-16 17:35:27

+0

這看起來與UTF-8編碼的文件讀取到ANSI編碼的字符串完全相同。請閱讀指定正確字符集的文件... – 2010-11-16 17:57:19

回答

0

嘗試在Windows記事本中打開該文件並查看它的外觀。如果看起來很好,那麼問題可能在其他地方(例如,您是否將數據發送到瀏覽器,而不是指定UTF-8?)。

如果它看起來錯在記事本太,試試下面的(我複製你的數據到一個文件,並能夠通過做這個「修復」的話):

  • 用記事本打開
  • 文件 - >另存爲 - >選擇 「ANSI」 並保存
  • 打開新文件在記事本中
  • 文件 - >另存爲 - >選擇UTF-8和保存

這決賽F ile應該在記事本中正確打開,並使用三字節UTF-8簽名編碼爲UTF-8。