2017-08-24 107 views
0

我已經找到了關於如何完成這些操作的信息,但沒有任何工作可以幫助我。我試圖替換特殊字符'ð'。我從csv文件導入了我的數據,並使用了encoding ='latin1',否則我不斷收到錯誤。然而,一個簡單的DF ['Column']。str.replace('ð','')不會做到這一點。我也嘗試解碼並使用在另一篇文章中推薦的那個字符的十六進制值,但這仍然不適用於我。非常感謝幫助,如果需要,我願意發佈代碼。刪除熊貓數據框中的特殊字符

回答

2

呼叫str.encode其次str.decode

df.YourCol.str.encode('utf-8').str.decode('ascii', 'ignore') 

如果您想爲多列做到這一點,你可以切片,並呼籲df.applymap

df[col_list].applymap(lambda x: x.encode('utf-8').decode('ascii', 'ignore')) 

請記住,這些操作不到位。所以,你必須將這些列分配回合適的位置。

+0

謝謝!那究竟做了什麼?我只想專門擺脫'ð'而沒有別的。 – SKlein

+0

它清除每個非ascii或加重字符的數據幀。 –