我試圖創建一箇中文網頁,我意識到,雖然文本看起來很好,但是當我在瀏覽器上運行它時,一旦我更改了字符編碼,文本就會變成亂碼。以下是發生了什麼:關於中文編碼的問題
- 我在Emacs中創建我的html文件,以UTF-8編碼。
- 我將它上傳到服務器,並在我的瀏覽器(FF,IE,Chrome,Opera)上查看 - 沒問題。
- 我嘗試通過FF> View> Character Encoding>其他編碼查看頁面。所有這些不同的中文編碼系統,例如簡體中文(HZ)
- 除了UTF-8之外,在其他所有編碼中,文本都變成亂碼。
我假設這不是一個問題 - 即瀏覽器足夠聰明,知道該頁面在哪個編碼,並準確解析內容。我想知道的是,爲什麼我改變編碼後不能再閱讀中文文本 - 是因爲我沒有在我的操作系統上安裝中文字體?如果我的聽衆是中國人,我應該堅持使用UTF-8嗎?還是應該在衆多編碼系統中選擇一種?
在此先感謝您的幫助/意見。
重新鍵入文字?你是否說我應該創建單獨的文件,每個文件都用不同的編碼編寫和保存?那麼我如何決定要提供哪個文件? – anthonytwp 2012-04-24 10:40:35
是的 - 但您應該遵循Agent_L的建議並在HTML中定義字符集編碼,這將節省更多時間。如果你需要單獨的文件,應該可以編寫一個腳本來自動將UTF-8編碼爲需要支持的每一種其他編碼,但是前瞻性地說,擁有相同內容的多個副本可能會成爲維護的麻煩。 – MHTri 2012-04-24 11:28:49
我認爲他的意思是當客戶端請求一個文件並在其他編碼中明確要求它時。儘管可能,但現代瀏覽器不太可能不支持utf-8(對我而言,我/我們有偏見的知識)。 – 2012-04-24 15:57:44