2012-02-26 65 views
1

有誰知道這是什麼樣的編碼?未知的編碼

\u042e\u043b\u0438\u044f 

我唯一知道的是,這是在非拉丁字母

+0

有可能像'while while read -n1 char;做printf'\\ u%04x'''$ char「;完成<<< $(echo -n'торги'); echo'和'while read -r line;做echo -e「$ line」;完成 user3132194 2015-09-29 05:41:58

回答

3

這是「Юлия」(朱麗亞)在統一的名稱。

+0

爲了澄清,這可能是一個Unicode字符串的JavaScript表示形式。這對我在Chrome開發者工具控制檯中工作:'console.log(「\ u042e \ u043b \ u0438 \ u044f」)' – 2012-02-26 23:06:33

+0

感謝亞歷山大,你知道如何獲得它與python?我已經嘗試過編碼/解碼但沒有發財 – user1183090 2012-02-26 23:28:32

+0

Unicode不是一種編碼。 – tchrist 2012-02-27 02:02:30

1

\u通常用於表示數字Unicode碼點引用,在這種情況下您正在處理Unicode。您可以查看他們的代碼表以瞭解有關代碼點的精確定義。官方網站上的code charts爲您提供了定義範圍的概述,而this website可讓您按價值搜索。

1

它看起來像西裏爾字母塊中的UTF-16字符。

U+042E CYRILLIC CAPITAL LETTER YU 
U+043B CYRILLIC SMALL LETTER EL 
U+0438 CYRILLIC SMALL LETTER I 
U+044F CYRILLIC SMALL LETTER YA 
0

你知道如何使用Python獲得它?

原則unicode-escape

>>> '\\u042e\\u043b\\u0438\\u044f'.decode('unicode-escape') 
u'\u042e\u043b\u0438\u044f' 
>>> print _ 
Юлия # dependent on your terminal supporting Unicode 

然而,這僅僅解碼\u序列,而這很可能不是你真正想做的事。

還有很多不同的語言,我們\u作爲字符串文字編碼,包括JavaScript和Python。每個關於其他\ -escape序列如何工作的規則都略有不同,並且可能圍繞處理UTF-16代理。所以你真的需要知道你正在處理什麼確切的語言,並使用爲該語言設計的解析器。

JSON通常是一個很好的初步猜測。

+0

問題是我不能使用打印,因爲我必須操縱這些字符串並將名稱與傳統數據庫中存在的其他名稱進行比較......因此,任何想法都可以在沒有打印的情況下獲得結果? – user1183090 2012-02-27 22:32:39

+0

你有結果。字符串'u'\ u042e \ u043b \ u0438 \ u044f'' *是字符串'u'Юлия''。 – bobince 2012-02-27 22:40:11