分割和非拉丁字母字符串在Python 2.X

例子：分割和非拉丁字母字符串在Python 2.X

# -*- coding: utf-8 -*- 
my_str = u'Строка^с^разделителями!' # Russian letters 
print my_str.replace(' ', '') 
print my_str.replace(' ', '').split('^')

結果：

Строка^с^разделителями! 
[u'\u0421\u0442\u0440\u043e\u043a\u0430 ', u' \u0441 ', u' \u0440\u0430\u0437\u0434\u0435\u043b\u0438\u0442\u0435\u043b\u044f\u043c\u0438!']

請幫助。如何在分割後顯示「正常」字符串？

P.S. 文件腳本編碼是UTF8

來源

2011-12-01 SkyFox

主西里爾語塊是0x400-0x4ff。打印列表打印項目的'repr'，對於'unicode'對象顯示非ASCII代碼的代碼點形式（即'\ u ####'）。 – eryksun

這些是正常的字符串，你只看到其內部表示（因爲你沒有打印字符串，你打印在第二個例子中的列表）。做

for s in my_str.replace(' ', '').split('^'): 
    print s

你會看到。相反，嘗試

print repr(my_str.replace(' ', ''))

然後看看會發生什麼。

來源

2011-12-01 09:57:56

它的工作原理！謝謝！！！ – SkyFox

分割和非拉丁字母字符串在Python 2.X

回答

相關問題