2011-09-26 67 views
-1

任何人都有一個鏈接或最佳實踐來處理跨Python應用程序的Unicode字符?或者我們需要將字符串轉換到所有地方?在Python中處理Unicode的最佳方法

[編輯] 我們張貼在用urlencode爲utf-8,但我想知道是否有更好的方式來處理,而不是調用編碼(「UTF-8」)

+2

在Python 2中使用'unicode'。在Python 3中使用'str'。如果你需要更多的幫助,我建議你寫一些具體細節的真正問題。 –

回答

1

Python documentation on unicode目前我們正在轉換的一切。

總之:內部只能與unicode對象一起使用。如果您需要儘可能早地與外界交流,.decode()可以在輸入時儘早輸入,.encode()可以輸出。

2

您需要做的主要事情是瞭解 unicode。認識到Python中的str存儲字節,而unicode對象存儲字符;他們是不同的東西,不應該被視爲可互換。所有文本字符串應始終爲unicode對象;一切都是二進制數據。

欲瞭解更多,請查看我的文章getting Unicode right in Python