我想使用pd.read_csv讀取csv文件。我遇到了編碼問題,我不知道如何繼續。我遇到的第一個問題是在讀取包含μ字符的csv fiels時導致的以下錯誤消息。 「SyntaxError:第4行文件GUI_Simpilify.py中以'\ xb5'開頭的非UTF-8代碼,但未聲明編碼;有關詳細信息,請參閱http://python.org/dev/peps/pep-0263/「pd.read_csv不知道如何確定我的csv文件的編碼
我能夠通過手動更改文件名並刪除μ來獲取此錯誤。但是,這不是一個解決方案,因爲我有1000個csv文件來提取數據。
一旦我手動從一個CSV文件中刪除μ,並重新運行我的劇本我收到此錯誤信息: 「的UnicodeDecodeError:‘UTF-8’編解碼器不能在13位解碼字節0xb1:無效的起始字節」
我相信這是因爲我所有的csv文件都包含±和μ字符。 如何處理這些錯誤而無需手動解決方案?
代碼:
import pandas as pd
test_csv = pd.read_csv('OFN 0.1pg_L Split 20-1 (5 fg on column).csv')
嘗試:pd.read_csv(** **ü'OFN 0.1pg_L斯普利特20-1(5 FG上欄).csv格式) –
同時,你有沒有考慮在沒有姓名和循環的目錄中鍵入。看看這裏:https://stackoverflow.com/questions/10377998/how-can-i-iterate-over-files-in-a-given-directory –
csvs從哪裏來?嘗試明確指定編碼,如'pd.read_csv('filename.csv',encoding ='utf8')',而不是'utf8',你可以嘗試'cp1250'或'cp1252'來進行windows-like-encoding ,或''latin1'很常見。參考這裏獲取更完整的列表https://docs.python.org/3/library/codecs.html#standard-encodings –