有可能簡化而不丟失太多的ASCII一些Unicode字符。的Unicode轉換爲ASCII(如果可能)
實施例:
>>> unicodedata.name(u'-')
'HYPHEN-MINUS'
>>> unicodedata.name(u'−')
'MINUS SIGN'
在上述情況下,我更喜歡 「HYPHEN-MINUS」,因爲 「減號」 不是ASCII。
我可以很容易地寫我自己的翻譯,但我不喜歡重新發明輪子。
有沒有簡單的方法來翻譯特殊的Unicode字符爲簡單的ASCII字符?
我知道這是猜測,只適用於某些unicode字符,但在這種情況下沒關係。
最簡單的方法:使用映射像你這樣,但不要重新發明輪子。改用[Unidecode](https://pypi.python.org/pypi/Unidecode)(是的,它將MINUS SIGN映射到HYPHEN-MINUS)。 –