4
我使用BeautifulSoup正確解碼/編碼字符串,我回來一個字符串是這樣的:Unicode的問題,蟒蛇
u'Dassault Myst\xe8re'
這是一個unicode的,但我要的是使它看起來像:
'Dassault Mystère'
我已經試過
name = name.encode('utf-8'), decode(), unicode()
我不斷收到的錯誤是:
UnicodeEncodeError: 'ascii' codec can't encode character u'\xe8'
我的默認編碼似乎是 'ASCII':sys.getdefaultencoding()返回 'ASCII' 即使我有:
#!/usr/bin/env python
# encoding: utf-8
在文件的頂部。
希望一勞永逸地解決這個反覆出現的Unicode問題!
感謝
那麼,這固定打印到控制檯問題。 但是當我建立一個url時,我仍然有一個問題,因爲當我發出一個http請求時,在它上面追加 - u'Dassault Myst \ xe8re'url urllib2扼流器。我猜這是期待一個ascii字符串,而我正在發送別的東西? – Maverick 2011-03-12 22:44:42
我的網址看起來像這樣:u'http://www.youtube.com/results?search_query = Dassault + Myst \ xe8re&aq = 0' 和urllib2並不喜歡它。 – Maverick 2011-03-12 22:47:27
第二部分解決使用這個答案︰http://stackoverflow.com/questions/4389572/how-to-fetch-a-non-ascii-url-with-python-urlopen – Maverick 2011-03-12 22:55:11