擁有對所有客戶的交易數據在過去的10年裏,我有一個數據幀DF:Python的大熊貓日期GROUPBY數計算的閾值的第一個實例
Customer_ID | date | year | Dollars
ABC 2017-02-07 2017 456
ABC 2017-03-05 2017 167
ABC 2017-07-13 2017 345
ABC 2017-05-15 2017 406
ABC 2016-12-13 2016 320
ABC 2016-01-03 2016 305
ABC 2016-10-10 2016 456
ABC 2016-05-10 2016 175
ABC 2015-04-07 2015 145
BCD 2017-09-08 2017 155
BCD 2016-10-22 2016 274
BCD 2016-10-19 2016 255
我想補充一個標誌,當客戶第一次參加一年的第四次訪問。
因此,這將是輸出:
Customer_ID | date | year | Dollars | Flag
ABC 2017-02-07 2017 456
ABC 2017-03-05 2017 167
ABC 2017-07-13 2017 345
ABC 2017-05-15 2017 406
ABC 2016-12-13 2016 320 X
ABC 2016-01-03 2016 305
ABC 2016-10-10 2016 456
ABC 2016-05-10 2016 175
ABC 2015-04-07 2015 145
BCD 2017-09-08 2017 155
BCD 2016-10-22 2016 274
BCD 2016-10-19 2016 255
我會做一些這樣的方式,但它不產生輸出需要,我不知道他們的標誌在第一時間如何度過第四次訪問。
df ['Flag'] = np.where(df[['Customer_ID']].groupby(['year']).agg(['count'])>3, 'X','0')
示例正確嗎?我認爲'X'應該顯示在'2016-12-13' – Wen
正確的 - 謝謝你抓到它(原始數據遍歷段落,並且我在錯誤的地方添加了X) – jeangelj
已修復!很抱歉 – jeangelj