我有一個UTF8字符串管道從Java到Python。UTF8 python編碼和解碼
最終的結果是
'\xe0\xb8\x9a\xe0\xb8\x99'
因此,例如
a = '\xe0\xb8\x9a\xe0\xb8\x99'
a.decode('utf-8')
給我的結果
u'\u0e1a\u0e19'
不過,我很好奇,是因爲字節作爲管道UTF-8,爲什麼會是
'\xe0\xb8\x9a\xe0\xb8\x99'
而不是u'\u0e1a\u0e19'
。
如果我是編碼(u'\u0e1a\u0e19')
我還是會回到'\xe0\xb8\x9a\xe0\xb8\x99'.
那麼究竟是什麼這兩個怎麼我的確瞭解什麼時候使用解碼和編碼之間的固有差異。
..甚至「二百二十四」是二進制表示11100000的*十進制表示*,它僅僅是一些電子被推過某些摻雜硅的二進制表示*,它只是一個*標準模型表示*我們對亞原子粒子有些微弱的理解,這是弦理論的東西。 – roippi 2015-03-19 01:30:05
@Malvolio那麼我什麼時候使用解碼和編碼?說我要寫這個字符串到一個文件。我是否需要將u'\ u0e1a \ u0e19編碼爲UTF8或將文件寫入\ xe0 \ xb8 \ x9a \ xe0 \ xb8 \ x99文件中顯示文件 – aceminer 2015-03-19 01:30:30
@aceminer中相應的UTF8字符บน我將我的答案顯着擴展到回答你的問題。 – metatoaster 2015-03-19 01:38:38