2010-05-25 112 views
0

該數據來自Oracle數據庫,並以編碼'WE8MSWIN1252'的形式提取到平面文件。如何將WE8MSWIN1252中編碼的數據轉換爲utf8以用於Python腳本?

我想解析數據並做一些分析。我想看到文本字段,但不需要將結果發佈到任何其他系統,所以如果某些字符沒有完全轉換,我沒有問題。

我只是不想我的解析失敗,解碼錯誤這是我所得到的,如果我使用:

INPUTFILE = codecs.open(dataFileName, 「R」, 「UTF-8' 」)

回答

2

從最後幾個字符開始,我猜測這個編碼就是世界其他地方所稱的windows-1252。所以請嘗試:

inputFile = codecs.open(dataFileName, "r", "windows-1252") 
相關問題