1
我有一個DataFrame包含EffectiveDate
列。 我想通過Key值對DataFrame進行分組,然後計算每個組中EffectiveDate
列的所有日期值的平均時間間隔。熊貓得到組內的平均時間間隔
例如,對於數據幀:
EffectiveDate
1 2015-08-17 07:00:00
1 2015-08-18 07:00:00
1 2015-08-19 07:00:00
2 2015-08-20 07:00:00
2 2015-08-21 07:00:00
2 2015-09-16 07:00:00
2 2015-10-15 07:00:00
2 2015-11-16 08:00:00
欲GROUPBY指數並計算在EFFECTIVEDATE列中的日期值之間的平均間隔。
15199 2015-08-17 07:00:00
15214 2015-08-18 07:00:00
15219 2015-08-19 07:00:00
15233 2015-08-20 07:00:00
15254 2015-08-21 07:00:00
15687 2015-09-16 07:00:00
199 2015-10-15 07:00:00
1123 2015-11-16 08:00:00
Name: EffectiveDate, dtype: datetime64[ns]
在單系列這似乎很好地工作:當我使用相同的功能,在大熊貓據幀一GROUPBY彙總然而
EffectiveDate.diff().astype('timedelta64[s]').mean()
:
df.groupby('Key').agg({
'EffectiveDate': lambda x: x.diff().astype('timedelta64[s]').mean()
})
結果是
EffectiveDate
1 1970-01-01 00:00:00.016747425
2 1970-01-01 00:00:00.017765280
3 1970-01-01 00:00:00.034776096
4 1970-01-01 00:00:00.002052450
5 1970-01-01 00:00:00.018238800
6 1970-01-01 00:00:00.024005438
7 1970-01-01 00:00:00.
我期望每列中的整數字段。我正在使用熊貓0.19.2
。
的結果將是每個組中的'Key'列,這似乎不符合您的輸出平均值。你能否包括你的完整數據框,以及你正在做什麼? – miradulo
另外,你使用的是什麼版本的熊貓?我不能用0.18.1重現這一點。 – miradulo
@你說得對。我無法在0.18.1中重現這一點,我正在使用0.19.2 – user113531