我有一個像轉換一個Unicode對象拉丁字符串實體
x = u"a & 日本語: enči hallöle"
一個Unicode對象,並希望將其轉換成Latin-1的字符串HTML的實體,如
"a & 日本語: enči hallöle"
的背後的原因是,我希望我的用戶能夠輸入unicode數據,但我需要保存數據的傳統數據庫只接受latin-1字符串。 (「ö」不應轉換,但其他特殊字符必須轉換)
任何想法哪個模塊在這裏使用?我通過編碼模塊搜索,查找了一些編解碼器,嘗試了一些unicode對象的方法,但沒有找到明智的解決方案。
我會存儲UTF-8字節的Latin-1字符相同數字,並在數據訪問層中進行字符集轉換。給出比HTML編碼更小的結果,並且不會誘使您直接從數據庫輸出到HTML頁面。 – bobince 2012-02-03 15:05:52