我創建了以下代碼,它計算一個人(通過他們的login_id)在一年中登錄到程序的次數。Python中的計數和groupby
data1.query("'2015-12-01' <= login_date <= '2016-12-01'").groupby(['employer_key','account_id']).size().reset_index().groupby(['employer_key','account_id'])[[0]].count()
輸出看起來是這樣的:
employer_key account_id # times logged in
Apple X1 1
Google Y5 2
Facebook X3 4
Apple X2 2
Facebook Y2 1
我想算account_ids的數量爲每個單獨employer_key,這樣我可以確定多個賬戶如何記錄在每一個人的僱主在一年的時間。
輸出會希望是這個樣子:
employer_key user_logins
Apple 2
Google 1
Facebook 2
多少*獨特*帳戶? –
在我的實際數據集中,我有數千人。 – PhishFood
不,我的問題是,如果你想爲每個僱主統計*獨特*用戶。我認爲你的數據可能已經在該列中只有唯一的'account_id',所以它可能是一個爭議點。 –