從Java規範SE 7版如何用Unicode編寫程序?
3.1節統一
程序使用Unicode字符集編寫的。
§3.2詞彙翻譯
原始Unicode字符流被翻譯成的 令牌的序列,使用以下三個詞彙翻譯步驟......
我很困惑,因爲我寫我的源代碼與我的本地字符編碼(WINDOWS-1252),以及規範menti (?)全部從原始Unicode字符流開始,然後執行詞法翻譯(包括Unicode轉換轉換)。
他們提到的Unicode轉義可用於包括使用 只有ASCII字符的Unicode字符;如果執行先前的轉換,我認爲它們指的是Unicode字符集的子集中的ASCII字符,這很有意義。
有從以前寫的源文件的Unicode編碼之前的轉換?
一些相關的信息,但我認爲這是比較厚道的運行文本處理,而不是在編譯過程:
假設您的編譯器將能夠將您的源代碼文件*轉換爲內部的unicode表示。對於語言規範的目的而言,實際的物理文件的格式應該不重要。 – 2012-08-16 20:34:08
CP-1252是一種**編碼**,並且該規範討論了**字符集**。所有由CP-1252支持的字符都確實包含在Unicode字符集中。 – 2012-08-16 20:37:03