2015-09-26 83 views
0

我開始玩熊貓了。解碼錯誤 - 輸出不是utf-8 - 熊貓/ python 2.7/excel/win

我下載了一個谷歌表。

當從Excel中讀取一些數據在Win7:

xls = pd.ExcelFile('C:/Users/file.xlsx') 
data = xls.parse('Sheet 1', index_col=None, na_values=['NA']) 
print "Data", data 

我是一個越來越:

Decode error - output not utf-8 

原始Excel文件有文字和數字。

出了什麼問題?

謝謝,

回答

0

嘗試添加不同的編碼參數如iso-8859-1。這裏是一個詳盡的list from the Internet Assigned Numbers Authority (IANA)。雖然數據可能看起來像合法的拉丁數字和文本,但根據起始情況,一個字符可能需要不同的字符集。

你也可以使用兩個步驟的過程,ExcelFile或一步法,read_excel

ExcelFile

xls = pd.ExcelFile('C:/Users/file.xlsx') 
data = xls.parse('Sheet 1', index_col=None, na_values=['NA'], encoding='iso-8859-1') 
print data.head() 

read_excel

data = pd.read_excel('C:/Users/file.xlsx', 'Sheet 1', encoding='iso-8859-1') 
print data.head() 
+0

謝謝你的回答。不幸的是迄今爲止沒有工作我會繼續嘗試。 – Diego

+0

試試這個受歡迎的編碼列表[這裏](http://stackoverflow.com/questions/8509339/what-is-the-most-common-encoding-of-each-language)。通常字符集取決於文件來源的語言。 – Parfait

+0

謝謝你的名單。我正在導入的谷歌表是我的。我認爲當我將它下載到我的電腦上的excel文件時可能會出現格式問題。你怎麼看? – Diego

0

這是因爲,您的數據編碼將從ASC更改II拉丁文1。試試這個編碼cp1252