1
A
回答
3
你可以使用
\w+
與Unicode的標誌。我假設你的名字沒有數字或下劃線的風險。
>>> re.findall('\w+', 'Márquez', re.U)
['Márquez']
也似乎問號後失蹤P
:(?P<name>[a-zA-Z]+)
0
對於Python < 3,你可能希望啓用區域:
import locale
locale.setlocale(locale.LC_ALL, '')
然後用re.LOCALE
選項會regexpes :
re.findall('\w+', 'Márquez', re.LOCALE)
雖然,大概Unicode是更好的路要走,但它需要的數據進行解碼和編碼它到你的本地編碼。
相關問題
- 1. 正則表達式字母數字字符串+特殊字母
- 2. 正則表達式4個字母的特殊字符
- 3. 大寫字母,2個特殊字符的正則表達式
- 4. 正則表達式與特殊字符
- 5. 正則表達式的特殊字符
- 6. 特殊字符的正則表達式
- 7. 特殊字符的正則表達式?
- 8. 特殊字符正則表達式
- 9. 正則表達式和特殊字符
- 10. 正則表達式Python字符串忽略特殊字符
- 11. 正則表達式來驗證字母數字和特定的特殊字符
- 12. Python中正則表達式中的特殊字符問題
- 13. 正則表達式與Python中的特殊字符不匹配
- 14. 正則表達式考慮字符串中的特殊字符
- 15. 正則表達式允許一個特殊字符(:)和數字和字母只
- 16. 正則表達式:任何字母,數字和0到3特殊字符
- 17. 正則表達式允許字母數字,空格,一些特殊字符
- 18. 正則表達式字母數字和一些某些特殊字符
- 19. Javascript成爲正則表達式字母,數字和特殊字符
- 20. JavaScript正則表達式包含字母數字和特殊字符
- 21. 查找與Python正則表達式特殊字符
- 22. 正則表達式在python中爲特殊字符
- 23. 正則表達式和正則表達式的特殊字符在JavaScript
- 24. 特殊字符之間的數字的正則表達式
- 25. 排除數字或特殊字符的正則表達式
- 26. 正則表達式的數字,一些特殊字符和NULL
- 27. 正則表達式,以排除特殊字符的名字
- 28. Python正則表達式輸入搜索字符串的特殊字符
- 29. 轉義正則表達式特殊字符爲tr1 ::正則表達式
- 30. Java正則表達式匹配特定的特殊字符
這並不好看的Python <3.0 - 我不喜歡使用與普通(非Unicode)字符串的UNICODE選項的想法。 – 2010-03-09 19:46:21
@Jacek:爲什麼你非ASCII字符串不是Unicode? – SilentGhost 2010-03-09 19:48:30
在Python 2.x的STR型和「XXXX」文字只包含一個字節的字符串。這些字節可能是特定編碼中的某些字符,但是沒有編碼信息,這些字符只是字節。 '馬爾克斯' 是:(77,195,161,114,113,117,101,122)(8個字節),如果您的編碼是 'UTF-8' 或(77,225,114,113,117,101,122 )(7字節)如果編碼是ISO 8859-1。當在ISO 8859-7中解碼時,相同的值將是「Mαrquez」。相同的字節,不同的字符。不知道編碼,我們不能談論Unicode字符。 – 2010-03-09 20:30:47