2017-02-23 126 views
1

我從讀取xls文件獲取數據幀時遇到了一些麻煩。 這種數據幀上的每個數據都有'unicode'類型,我無法對此做任何事情。我想改變它的價值。另外,如果可能的話,我想知道這個事實的原因。我聽說過一些關於「外部數據」的信息,而且我知道列和索引都會在這些名稱之前提供unicode的「u」。我幾乎不知道任何有關編碼的東西,如果有人解釋了這個問題,我會非常感激。將數據幀的Unicode數據轉換爲字符串

我使用Python 2和我tryed與功能列來解決它列

.astype(str) 
.astype(basestring) 
.apply(str) 

.str.decode('iso-8859-1').str.encode('utf-8') 

(我在這裏閱讀這最後一個,我只是寫在我的代碼嘗試另一件事)。我也試過

unicodedata.normalize('NFKD', df_bolsa[l]).encode('ascii','ignore') 

但這最後一個不能用於一系列。 我希望有人能夠幫助我澄清這件事。 非常感謝您提前!

+0

如何:http://stackoverflow.com/questions/2365411/python-convert-unicode-to-ascii-without-errors –

+0

謝謝你,但我真的不知道如何應用問題礦。無論如何,我會明天讀它試圖理解有關編碼的東西......再次感謝! –

回答

2
for column in df: 

      df[column] = df_peru[column].str.encode('utf-8')