0
我使用mutagen來讀取mp3元數據,因爲id3標籤是作爲unicode讀取的,但實際上它是GBK編碼的。如何糾正這在python中?如何糾正錯誤編碼的字符串?
audio = EasyID3(name)
title = audio["title"][0]
print title
print repr(title)
產生
µ±Äã¹Âµ¥Äã»áÏëÆðË
u'\xb5\xb1\xc4\xe3\xb9\xc2\xb5\xa5\xc4\xe3\xbb\xe1\xcf\xeb\xc6\xf0\xcb\xad'
但實際上應該在GBK(中國)。
當你孤單你會想起誰
GBK不是標準的一部分,所以誘變劑很適合弄錯。參見http://en.wikipedia.org/wiki/ID3 有效的編碼是latin1,utf16(帶有BOM或BE)和utf8,並用字節字段表示。 但看到如何解決這個問題的任何好的答案,我只是在觀察! – 2010-02-03 10:08:06