-2
,請給我一個範圍UTF-8 例子:範圍內的非ASCII的
>>> s
'\xe9\x98\xbf\xe5\xaf\x8c\xe6\xb1\x97Afghanistan'
>>>re.findall('[\x00-\xff]+',s)
['\xe9\x98\xbf\xe5\xaf\x8c\xe6\xb1\x97Afghanistan']
我需要出去放:
'\xe9\x98\xbf\xe5\xaf\x8c\xe6\xb1\x97'
' '[\ x00- \ XFF]''*一致的字節串的所有字節*。你的意思是你想要**非ASCII字節**嗎? –
聽起來好像你想要[用一個空格替換非ASCII字符](// stackoverflow.com/q/20078816) –
的反過來要清楚:ASCII是UTF-8的一個子集。任何有效的ASCII數據也是有效的UTF-8。 –