我花了幾個小時試圖在熊貓數據框上做一個「累計分組總和」。我已經看了所有的計算器答案和令人驚訝的沒有人可以解決我的(非常初級的)問題:Pandas group by cumsum keep colums
我有一個數據幀:
df1 Out[8]: Name Date Amount 0 Jack 2016-01-31 10 1 Jack 2016-02-29 5 2 Jack 2016-02-29 8 3 Jill 2016-01-31 10 4 Jill 2016-02-29 5
我想
- ['姓名','日期']和
- cumsum'金額'。
- 就是這樣。
因此所需的輸出是:
df1 Out[10]: Name Date Cumsum 0 Jack 2016-01-31 10 1 Jack 2016-02-29 23 2 Jill 2016-01-31 10 3 Jill 2016-02-29 15
編輯:我簡化了問題。目前的答案我仍然無法獲得正確的「跑步」cumsum。仔細觀察,我想看看累計總和「10,23,10,15」。換句話說,我希望在每一個連續的日期都能看到一個人的累計總和。注意:如果同一人在同一個日期有兩個條目,我想將它們相加,然後將它們添加到正在運行的cumsum中,然後纔打印總和。
我明白任何建議和/或幫助。
感謝您的答覆提供了相同的答案,但是第二組應該一概而論傑克的多個2016年2月29日金額在一起。所以Cumsum只能有四行寫着 「10,23,10,15」。我會嘗試與你仍然提供了什麼工作,謝謝。 – gmarais
請檢查編輯答案。 – jezrael
天才!完美的感謝 – gmarais