2011-12-21 74 views
4

我有存儲這樣從轉換unnnn字母

\u0410\u0411\u0426 

字母一個文件我想CONVER它們例如東西可讀 的\u0410\u0411\u0426意味着АБЦ

,但我什麼都不知道關於爲什麼A存儲爲\u0410或爲什麼Б存儲爲\u0411。 我怎麼能做這兩個之間的轉換?

回答

3
$ echo -e '\u0410\u0411\u0426' 
АБЦ 
$ printf '\u0410\u0411\u0426' 
АБЦ 
$ python3 -c 'print("\u0410\u0411\u0426")' 
АБЦ 
$ echo '\u0410\u0411\u0426' | ascii2uni -qaU 
АБЦ 
+0

只是爲了澄清:最後一個可以用於「文件」與ascii2uni -qaU <文件 – Nikodemus 2011-12-21 13:25:05

+0

他們都不是在bash 4.1.5中工作,但'echoАБЦ'工作,所以沒有編碼問題。你是否應用了任何特殊設置? – 2011-12-21 13:56:42

+0

@ A.H。我在'GNU Bash-4.2'上使用'Ubuntu 11.10'。沒有特別的設置。 – kev 2011-12-21 13:58:59

1
#irb -E binary 
ruby-1.9.3-p0 :001 > s="\u0410\u0411\u0426" 
=> "\u0410\u0411\u0426" 

#irb -E utf-8 
ruby-1.9.3-p0 :001 > s="\u0410\u0411\u0426" 
=> "АБЦ" 

你要讀一些關於字符編碼,unicodeUTF-8