>>> a = "我" # chinese
>>> b = unicode(a,"gb2312")
>>> a.__class__
<type 'str'>
>>> b.__class__
<type 'unicode'> # b is unicode
>>> a
'\xce\xd2'
>>> b
u'\u6211'
>>> c = u"我"
>>> c.__class__
<type 'unicode'> # c is unicode
>>> c
u'\xce\xd2'
b
和c
都是unicode的,但>>> b
輸出u'\u6211'
和>>> c
輸出u'\xce\xd2'
,爲什麼呢?Unicode和`解碼()`在Python
你使用什麼終端?我無法在我的Unicode gnome終端上重現結果('c === u'\ u6211'') – 2012-04-23 08:53:22
@ChrisMorgan我在IDLE中測試這些代碼。 – 2012-04-23 08:54:34
也可以用IDLE重新編寫 – 2012-04-23 09:00:12