我有一個非常大的文件,我試圖重新格式化運行QC檢查。這種格式非常奇怪,我如何將它製作成一個單獨的列,每個日期都有記錄?我該如何在熊貓中將31天的天數分成幾列,並將它們分組爲一列?
當前的代碼是:
group = df.groupby(['ID','MONTH'], as_index = True).sum()
數據框看起來像這樣的任何分組之前:
ID TASK MONTH 1 2 3 4 5 6 P502867 5.34545 201601 4.664981 4.6699 4.557714 P502867 5.34545 201602 4.736791 4.664536 4.751841 4.744383
頂部數字是該月的天,在本月專欄中,我們有每個對應月份至2016年(8月)。基本上我想按ID,月份分組,然後在每個月內分配每一天。因此,這將使我能夠在列表中運行並將其與具有日常記錄的另一個文件進行比較。輸出數據幀將看起來像:
ID TASK MONTH DAY VALUE P502867 5.34545 201601 1
P502867 5.34545 201601 2
P502867 5.34545 201601 3 4.664981 P502867 5.34545 201601 4 4.6699
而且它甚至可能是有益的月和日追加在一起嗎?如20160101,20160102.無論哪一個最簡單。
偉大的回答,非常感謝! – staten12