2017-06-21 69 views
0

我有兩列的大熊貓數據幀:使自定義電子表格與Python

year experiencesalary

我要救一個CSV文件,這兩列,並在的頭部有一些統計數據文件爲圖像中:

enter image description here

是否有任何選項與大熊貓或做我必須做一個腳本來寫行添加逗號betwee任何其他庫來處理這些n字段?

回答

1

可以讀取該文件作爲兩個獨立的部分(統計和CSV)

閱讀統計:

number_of_stats_rows = 3 
stats = pandas.read_csv(file_path, nrows=number_of_stats_rows, header=None).fillna('') 

閱讀剩餘文件:

other_data = pandas.read_csv(file_path, skiprows=number_of_stats_rows).fillna('') 
+0

我想創建文件,而不是讀取它。 –

2

熊貓不支持你想要什麼在這裏做。問題是你的格式是無效的csv。對於CSV的RFC指出每個記錄位於單獨的行,意味着一條線對應於一條記錄,並帶有一個可選標題行。您的格式會添加不符合記錄的平均值和最大值。

正如我所見,你有三條路要從這裏出發:i。您可以創建兩個單獨的數據框並將它們映射到csv文件(超精確值將爲3),其中一個包含您的記錄,另一個包含附加值。 II。先將數據框寫入csv,然後打開該文件並在頂部插入附加值。 III。但是,如果您的目標是導入excel,@gefero的建議是正確的提示:嘗試使用xslxwriter包直接寫入電子表格中的單元格。