我想下載page_source到一個文件。然而,每一次我得到一個:沒有Python unicode錯誤下載html
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc2 (or something else) in
position 8304: ordinal not in range(128)
我使用value.encode('utf-8')
嘗試過,但似乎每次拋出同樣的異常時間(除了手動試圖取代所有的非ASCII字符)。有沒有一種方法可以「預處理」HTML以將其變爲「可寫」格式?
什麼是文件的實際編碼? – 2012-01-09 03:11:08
使用UTF8 _而不是_ ASCII。 – SLaks 2012-01-09 03:15:09