我有一個數據集,列出了他們完成某些操作的員工和時間戳。它分爲三列:員工,日期,小時。在熊貓中執行excel-like countifs
我想統計每小時活動的員工數量。 Excel中我將通過添加第四列EmpFactor
爲此在其中予執行COUNTIFS
操作:
=1/COUNTIFS(Name range;Name;Date range;Date;Hour range;Hour)
我隨後可以通過在EmpFactor
列執行SUMIF
計算活性的員工數量。
我嘗試下面的代碼組成EmpFactor
使用列大熊貓:
for name,date,time in zip(df['Employee'],df['Date'],df['Time']):
df['EmpFactor'] = 1/(df[(df.Employee == name) and (df.Day == dag)
and (df.Time == tijd)].count())
然而,這是行不通的。我已經在SO上搜索了很多主題,但還沒有找到合適的答案。
這將有助於獲得樣本數據和預期輸出。 – Zero
它可能並不高雅,但如果你只是迭代你的數組和+ =到一個匹配的計數器,然後進行反演,那麼它就是一個開始。 –
謝謝!我選擇了後一種方法,這似乎奏效。 – TimH