2015-11-06 43 views
3

我已經將一個csv文件導入到python中,並且我正在使用熊貓。我需要輸出一個新的csv文件,其中只包含一些數據,並且按照與空白列不同的順序。新的csv文件將用於從一個系統導入數據,並且數據需要排隊。在python熊貓中編寫csv,需要更改列的順序並添加空白列

所以,如果原來的CSV文件有以下幾列

"date" "department" "name" "title" "employee id" 

我需要CSV文件中的行讀取

"name",,,,,"department",,,,"date",, 

我已刪除的列,我不需要:

del df["title"],def["employee id"] 

我寫了一堆空白列:

df[a] = ''; 
df[b] = ''; 
df[c] = ''; 

當我把它們寫到CSV順序我想

df.to_csv('outfile.csv', cols=["name","a","b","c","department","d","e","f","date","g","h"], index=False,header=False) 

它出來

date,department,,,,,,,,,,,name,, 

我應該用csv模塊來工作了這一特定類型的項目?我在閱讀文檔,但無法弄清楚我正在閱讀的內容如何適用於我的任務

+0

我認爲這將是更容易刪除的cols後重新索引:'df.reindex(列= [「名稱」,「A」,「b」, 「c」,「department」,「d」,「e」,「f」,「date」,「g」,「h」])。to_csv('outfile.csv',index = False,header = False) ' – EdChum

+0

謝謝,這樣做! – mattrweaver

回答

3

在我看來,reindex您的df會更容易,這會將cols按照您的願望排列列不存在把NaN值有:

df.reindex(columns=["name","a","b","c","department","d","e","f","date","g","h"]‌​).to_csv('outfile.csv', index=False,header=False)