2017-10-20 168 views
0

我需要轉換什麼,我認爲是從硒unicode字符串轉換爲可讀UTF8字符串(沒有在字符串的開頭uUnicode轉換爲UTF8字符串

但如果字符串已經是什麼UTF8編碼?然後多字節字符將被雙重編碼

td.text.encode('utf-8').strip() 
+0

您是否有具體問題? unicode字符串應該是編碼不可知的,編碼會給你一個字節字符串(基本上只是一個字節序列) – Felk

+0

Python中沒有「UTF-8編碼字符串」這樣的東西。一個字符串是一系列的Unicode字符。 UTF-8是一系列'byte'值。 – Tomalak

回答

0

如果unicode中的文本,您可以執行一個編碼操作來轉換爲utf-8。如果它已經在utf-8中,它將不會被雙重編碼。它只會拋出一個錯誤,說明:

AttributeError: 'bytes' object has no attribute 'encode