2012-03-11 73 views
6

因此,與蟒蛇正則表達式匹配,我們有\ w和其他受re.LOCALE標誌的含義是:如何找出哪些字符定義爲字母數字對於一個給定的語言環境

\ W

未指定LOCALE和UNICODE標誌時,匹配任何 字母數字字符和下劃線;這相當於 集[a-zA-Z0-9_]。對於LOCALE,它將匹配[0-9_]加上 ,無論字符在當前的 語言環境中定義爲字母數字。

所以我們要找出定義了什麼字符的字母數字對於一個給定的語言環境 - 說我們做了「區域-a」,我們有語言環境的列表,並希望找到一個上市一個的信息系統上的語言環境。任何快速查找信息的方法:一個python代碼片段或一行代碼,shell命令或者某處的參考資料。

回答

5

使用string.letters。

實施例:

>>> import locale 
>>> import string 
>>> locale.setlocale(locale.LC_ALL, 'en_US.UTF-8') 
'en_US.UTF-8' 
>>> string.letters 
'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz' 
>>> locale.setlocale(locale.LC_ALL, 'de_DE') 
'de_DE' 
>>> string.letters 
'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz\xaa\xb5\xba\xc0\xc1\xc2\xc3\xc4\xc5\xc6\xc7\xc8\xc9\xca\xcb\xcc\xcd\xce\xcf\xd0\xd1\xd2\xd3\xd4\xd5\xd6\xd8\xd9\xda\xdb\xdc\xdd\xde\xdf\xe0\xe1\xe2\xe3\xe4\xe5\xe6\xe7\xe8\xe9\xea\xeb\xec\xed\xee\xef\xf0\xf1\xf2\xf3\xf4\xf5\xf6\xf8\xf9\xfa\xfb\xfc\xfd\xfe\xff' 
>>> 
+0

感謝。工作得很好。 – 2012-03-11 05:56:07

相關問題