1
A
回答
1
如果eclipse設置丟失,或者程序在eclipse外部生成,西里爾字符可能會被破壞,沒有人注意到直到程序根據它們執行操作。這可能或可能不是一個可接受的風險。
假設這是關於this question中描述的程序,更可靠的替代方法是將西里爾文字符放在外部文件中而不是直接放入源代碼中,並使用UTF-8明確解析該文件。
1
如果只有幾個字符,你可以使用\uxxxx
符號:
char[][] translate = {
{'\u0430', 'a'},
{'\u0431', 'b'},
{'\u0432', 'v'},
{'\u0433', 'g'},
...
};
也有看native2ascii工具自帶的JDK,以原生文本轉換爲Unicode Latin-1的。
非常感謝!這正是它的意義所在。你能詳細解釋一下使用UTF-8解析嗎?我應該使用什麼關鍵方法? – 2010-06-16 08:57:20
@Emanuil:只需使用InputStreamReader並在讀取文件時指定編碼。或者使用像XML這樣的文件格式,其中編碼由文件本身指定(需要適當的頭文件並使用適當的XML解析器,該文件可以直接在文件上運行)。 – 2010-06-16 09:14:09
再次感謝!你一直很有幫助。 – 2010-06-16 09:25:26