可能重複:
What is the best way to remove accents in a python unicode string?
Python and character normalization去除重音和特殊字符
我想去掉口音,把所有字符轉換爲小寫,並刪除任何數字和特殊字符。
例子:
Frédé[email protected] - >弗雷德裏克
建議:
def remove_accents(data):
return ''.join(x for x in unicodedata.normalize('NFKD', data) if \
unicodedata.category(x)[0] == 'L').lower()
有沒有什麼更好的方法來做到這一點?
你能編輯你的答案,包括一些期望的輸入和輸出的例子嗎? – 2012-01-01 18:56:22
@Christian JonassenFrédé[email protected] - > frederic @@àbcd - > abcd%*tréçd - > trecd – Fred 2012-01-01 19:00:20
我使用python 3.x – Fred 2012-01-01 19:24:15