未知的編碼
回答
這是「Юлия」(朱麗亞)在統一的名稱。
爲了澄清,這可能是一個Unicode字符串的JavaScript表示形式。這對我在Chrome開發者工具控制檯中工作:'console.log(「\ u042e \ u043b \ u0438 \ u044f」)' – 2012-02-26 23:06:33
感謝亞歷山大,你知道如何獲得它與python?我已經嘗試過編碼/解碼但沒有發財 – user1183090 2012-02-26 23:28:32
Unicode不是一種編碼。 – tchrist 2012-02-27 02:02:30
\u
通常用於表示數字Unicode碼點引用,在這種情況下您正在處理Unicode。您可以查看他們的代碼表以瞭解有關代碼點的精確定義。官方網站上的code charts爲您提供了定義範圍的概述,而this website可讓您按價值搜索。
它看起來像西裏爾字母塊中的UTF-16字符。
U+042E CYRILLIC CAPITAL LETTER YU
U+043B CYRILLIC SMALL LETTER EL
U+0438 CYRILLIC SMALL LETTER I
U+044F CYRILLIC SMALL LETTER YA
你知道如何使用Python獲得它?
原則unicode-escape
:
>>> '\\u042e\\u043b\\u0438\\u044f'.decode('unicode-escape')
u'\u042e\u043b\u0438\u044f'
>>> print _
Юлия # dependent on your terminal supporting Unicode
然而,這僅僅解碼\u
序列,而這很可能不是你真正想做的事。
還有很多不同的語言,我們\u
作爲字符串文字編碼,包括JavaScript和Python。每個關於其他\
-escape序列如何工作的規則都略有不同,並且可能圍繞處理UTF-16代理。所以你真的需要知道你正在處理什麼確切的語言,並使用爲該語言設計的解析器。
JSON通常是一個很好的初步猜測。
問題是我不能使用打印,因爲我必須操縱這些字符串並將名稱與傳統數據庫中存在的其他名稱進行比較......因此,任何想法都可以在沒有打印的情況下獲得結果? – user1183090 2012-02-27 22:32:39
你有結果。字符串'u'\ u042e \ u043b \ u0438 \ u044f'' *是字符串'u'Юлия''。 – bobince 2012-02-27 22:40:11
- 1. 未知的文件編碼
- 2. 未知的數據編碼
- 3. unicode的未知編碼
- 4. ffmpeg,未知編碼器xvid
- 5. 未知編碼器 'libx264'
- 6. 帶有口音的PHP未知編碼
- 7. Magento的SOAP「未知內容編碼」
- 8. 未知編碼:IDNA在Python請求
- 9. 告訴gdb反彙編「未知」代碼
- 10. HTML到明文 - 未知原始編碼
- 11. SASS/SCSS - 未知編碼格式
- 12. Node.js WriteStream未知編碼錯誤
- 13. 試圖解析未知編碼
- 14. IronPython「LookupError:未知編碼:十六進制」
- 15. 轉換未知編碼希伯來語
- 16. py3k RC-1: 「LookupError:未知編碼:UFT-8」
- 17. 這是什麼編碼?需要解碼一些字符串。未知的編碼
- 18. 解碼未知NSData
- 19. 未知的iphone代碼
- 20. 未知代碼的網頁
- 21. Java Servlet:如何處理未知的編碼?
- 22. 將未知編碼的NSData網頁轉換爲NSString
- 23. 將未知編碼的文件從Python導入到MongoDB中
- 24. 消毒HTML - 獲取一些未知的編碼?
- 25. 從未知刪除非打印空格(對我)的編碼
- 26. Ruby 1.9:輸入編碼未知的正則表達式
- 27. LookupError:嵌入python下的未知編碼'big5'
- 28. 編譯QT代碼時出現奇怪和未知的錯誤
- 29. 編寫NFC代碼的Android導致「未知內容」類型
- 30. 未知格式解碼
有可能像'while while read -n1 char;做printf'\\ u%04x'''$ char「;完成<<< $(echo -n'торги'); echo'和'while read -r line;做echo -e「$ line」;完成
user3132194
2015-09-29 05:41:58