我試圖檢測事件發生時的第一個日期:在我的產品A的數據框中的這裏(請參閱數據透視表)我在2017年第一次存儲了20個項目-04-03。循環成日期並將函數應用到熊貓數據框中
所以我想創建一個新變量calle new_var_2017-04-03來存儲增量。另一方面在第二天2017-04-04我不介意如果該項目是現在50而不是20,我只想存儲只有第一個事件
它給了我幾個錯誤,我想至少知道,如果它背後的整個邏輯是有道理的,它的「Python化」,或者如果我在
raw_data = {'name': ['B','A','A','B'],'date' : pd.to_datetime(pd.Series(['2017-03-30','2017-03-31','2017-04-03','2017-04-04'])),
'age': [10,20,50,30]}
df1 = pd.DataFrame(raw_data, columns = ['date','name','age'])
table=pd.pivot_table(df1,index=['name'],columns=['date'],values=['age'],aggfunc='sum')
table
我傳遞的日期列表
dates=df1['date'].values.tolist()
走錯了路completeley
我想在列表「日期」中做一個反向循環,並在事件發生時創建一個變量。 僞代碼:與I-1我之前,我指的是在列表中的項目
def my_fun(x,list):
for i in reversed(list):
if (x[i]-x[i-1])>0 :
x[new_var+i]=x[i]-x[i-1]
else:
x[new_var+i]=0
return x
print (df.apply(lambda x: my_fun(x,dates), axis=1))
desidered輸出:
raw_data2 = {'new_var': ['new_var_2017-03-30','new_var_2017-03-31','new_var_2017-04-03','new_var_2017-04-04'],'result_a': [np.nan,20,np.nan,np.nan],'result_b': [10,np.nan,np.nan,np.nan]}
df2= pd.DataFrame(raw_data2, columns = ['new_var','result_a','result_b'])
df2.T
您可以發佈您需要的數據組? – MaxU
希望添加的結果,謝謝 – progster