我寫了一個簡單的應用程序,從維基頁面下載文章。當我搜索例如名爲Lech
時,我的代碼返回的字符串如Lech_Kaczy%C5%84ski
或Lech_Pozna%C5%84
而不是Lech_Kaczyński
和Lech_Poznań
。如何在Python中編碼和解碼百分比編碼(URL編碼)的字符串?
如何將這些字符解碼爲普通波蘭語字母?我試圖使用: urllib.unquote(text)
但後來得到Lech_Kaczy\xc5\x84ski
,Lech_Pozna\xc5\x84
而不是Lech_Kaczyński
和Lech_Poznań
。
我有我的代碼:
# -*- coding: utf-8 -*-
import sys
reload(sys)
sys.setdefaultencoding("utf-8")
但結果是一樣的(它只是不工作)。
@PeterWood:嘗試過,但我得到的字符串,比如'Lech_Kaczy \ XC5 \ x84ski'代替。我想知道如何將其轉換爲波蘭語字母。 – yak
可能的重複[如何在python中取消一個urlencoded unicode字符串?](http://stackoverflow.com/questions/300445/how-to-unquote-a-urlencoded-unicode-string-in-python) –