ID Year Firm Score
1 2005 A 2
1 2006 A 5
1 2006 B 1
1 2007 A 36
1 2007 E 69
1 2008 E 8
1 2008 B 54
1 2009 A 25
1 2009 C 2
1 2010 E 2
1 2010 B 2
1 2011 A 5
1 2011 B 5
1 2012 A 4
1 2012
我有一個數據框與多個索引,並希望創建一些數據的滾動總和,但索引中的每個ID。 例如,讓我們說我有兩個指標(商行和年),我有名字ZDATA一些數據。下面的工作示例如下: import pandas as pd
# generating data
firms = ['firm1']*5+['firm2']*5
years = [2000+i for i in range(5)]*2
zdat
我有一個不規則的時間序列,我試圖用與R相關的每個與ID有關的操作的3個月窗口的滾動總和來計算。 數據結構如下 ID Operation date value
A 1 01/01/2017 0
A 2 01/02/2017 1
A 3 01/06/2017 1
A 4 01/09/2017 0
B 1 01/03/2017 0
B 2 0
我使用Python3和pandas版本'0.19.2'。 我有一個熊貓DF如下: chat_id line
1 'Hi.'
1 'Hi, how are you?.'
1 'I'm well, thanks.'
2 'Is it going to rain?.'
2 'No, I don't think so.'
我想組由「chat_id」,然後做一些像「線」滾動
我有以下形式的熊貓數據幀: import pandas as pd
df = pd.DataFrame({
'a': [1,2,3,4,5,6],
'b': [0,1,0,1,0,1]
})
欲組由「B」的值的數據,並添加新的列「C」,其包含一個爲每個組滾動總和'a',然後我想將所有組重新組合成一個包含'c'列的未分組的DataFrame。只要我有: for i, g