UnicodeDecodeError：'ascii'編解碼器無法解碼位置6233中的字節0xf0：序號不在範圍內（128）

我正在處理新項目，但無法解決標題中的錯誤。UnicodeDecodeError：'ascii'編解碼器無法解碼位置6233中的字節0xf0：序號不在範圍內（128）

下面的代碼：

#!/usr/bin/env python3.5.2 

import urllib.request , urllib.parse 


def start(url): 
    source_code = urllib.request.urlopen(url).read() 
    info = urllib.parse.parse_qs(source_code) 
    print(info) 


start('https://www.youtube.com/watch?v=YfRLJQlpMNw')

來源

2017-05-04 Salah Eddine

錯誤消息是自我解釋的：輸入字符串中有一個字節0xf0，該字符串應該是一個ascii字符串。

您應該給出確切的錯誤消息以及它發生了什麼行，但我可以猜到發生在info = urllib.parse.parse_qs(source_code)上，因爲parse_qs需要unicode字符串或ascii字節字符串。

第一個問題是，爲什麼你叫parse_qs數據來自YouTube的到來，因爲Python的斯坦達特庫的醫生說：

Parse a query string given as a string argument (data of type application/x-www-form-urlencoded). Data are returned as a dictionary. The dictionary keys are the unique query variable names and the values are lists of values for each name.

所以你要分析這個對=和&性格來解釋它作爲查詢字符串形式key1=value11&key2=value2&key1=value12給予{ 'key1': [ 'value11', 'value12'], 'key2': ['value2']}。

如果你知道爲什麼你想要的，你應該先字節串解碼成unicode字符串，使用正確的編碼，或者如果不確定Latin1這是能夠接受任何字節：

def start(url): 
    source_code = urllib.request.urlopen(url).read().decode('latin1') 
    info = urllib.parse.parse_qs(source_code) 
    print(info)

來源

2017-05-04 13:56:03

嘗試，因爲這.encode一個Unicode對象上工作發生這種

source_code = urllib.request.urlopen(url).read().decode('utf-8')

來源

2017-05-04 13:31:19 mtkilic

感謝你這麼很多，它的工作 –

錯誤。因此，我們需要利用

.decode('unicode_escape')

因此，代碼將是字節字符串轉換成Unicode字符串：

#!/usr/bin/env python3.5.2 

import urllib.request , urllib.parse 


def start(url): 
    source_code = urllib.request.urlopen(url).read() 
    info = urllib.parse.parse_qs(source_code.decode('unicode_escape')) 
    print(info) 


start('https://www.youtube.com/watch?v=YfRLJQlpMNw')

來源

2017-05-04 13:31:41

謝謝你先生它完美的作品 –

此代碼是相當奇怪的確實。您正在使用查詢解析器來解析網頁的內容。因此，而不是使用parse_qs，你應該使用類似this。

來源

2017-05-04 13:31:42

UnicodeDecodeError：'ascii'編解碼器無法解碼位置6233中的字節0xf0：序號不在範圍內（128）

回答

相關問題