2009-09-01 63 views
1

我有一個包含一個文本文件,什麼我告訴都是Unicode字符,例如:如何閱讀Unicode字符準確

\320\222\320\21015-25'ish per main or \320\222\320\21020-40'ish per starter

哪些應該閱讀:

£15-25'ish per main or £20-40'ish per main starter

然而,當在Firefox中查看此文本時,輸出會被各種不需要的字符打亂。

那麼,這些真的是unicode字符?如果是這樣,我怎樣才能將它們轉換爲可正確顯示的表單?

+0

肯定讀到:http://www.joelonsoftware.com/articles/Unicode.html。 – 2009-09-01 14:23:33

回答

3

您需要:

  • 知道該文本文件
  • 閱讀,而不會丟失信息數據的編碼(通過閱讀它作爲二進制或用正確的編碼閱讀它作爲文本)
  • 寫與正確的編碼數據(或者通過在二進制寫出來並指定原始編碼,或在編碼您在報頭中指定寫出來作爲文本)

試着將問題分解爲「閱讀」和/或「寫作」。你知道文件的編碼嗎?你與文件有什麼關係?當你用反斜槓寫的時候,實際上是文件內容(即轉義形式),還是實際上只是一個「普通」文本編碼,如UTF-8?