大熊貓慣用方式定製fillna

我有以下格式的時間系列數據，其中一個值表示自過去記錄以來的累計數量。我想要做的是「傳播」是累積金額超過含有楠過去的週期，使此輸入：大熊貓慣用方式定製fillna

s = pd.Series([0, 0, np.nan, np.nan, 75, np.nan, np.nan, np.nan, np.nan, 50], 
       pd.date_range(start="Jan 1 2016", end="Jan 10 2016", freq='D')) 

2016-01-01  0.0 
2016-01-02  0.0 
2016-01-03  NaN 
2016-01-04  NaN 
2016-01-05  75.0 
2016-01-06  NaN 
2016-01-07  NaN 
2016-01-08  NaN 
2016-01-09  NaN 
2016-01-10  50.0

變爲輸出：

2016-01-01  0.0 
2016-01-02  0.0 
2016-01-03 25.0 
2016-01-04 25.0 
2016-01-05 25.0 
2016-01-06 10.0 
2016-01-07 10.0 
2016-01-08 10.0 
2016-01-09 10.0 
2016-01-10 10.0

是否有地道的熊貓辦法做到這一點而不只是做一個循環的數據？我已經嘗試了多種涉及fillna,dropna,isnull，做shift來檢查下一個值等，但我看不出如何把這些碎片放在一起。

來源

2016-12-14 Kiv

有趣的問題。我不認爲有內置的方式，不幸的是，你可能不得不結束循環。 –

這可能會實現，對於缺失值的每個組塊，創建一組變量與cumsum（來自系列的結尾），然後對每個組塊進行分組的平均操作：

s.groupby(s.notnull()[::-1].cumsum()[::-1]).transform(lambda g: g[-1]/g.size) 

#2016-01-01  0.0 
#2016-01-02  0.0 
#2016-01-03 25.0 
#2016-01-04 25.0 
#2016-01-05 25.0 
#2016-01-06 10.0 
#2016-01-07 10.0 
#2016-01-08 10.0 
#2016-01-09 10.0 
#2016-01-10 10.0 
#Freq: D, dtype: float64

或者另一種選擇：

s.groupby(s.shift().notnull().cumsum()).transform(lambda g: g[-1]/g.size) 

#2016-01-01  0.0 
#2016-01-02  0.0 
#2016-01-03 25.0 
#2016-01-04 25.0 
#2016-01-05 25.0 
#2016-01-06 10.0 
#2016-01-07 10.0 
#2016-01-08 10.0 
#2016-01-09 10.0 
#2016-01-10 10.0 
#Freq: D, dtype: float64

來源

2016-12-14 20:35:44 Psidom

大熊貓慣用方式定製fillna

回答

相關問題