2017-07-28 41 views

回答

5

您可能需要閱讀this Pandas docs

軋製統計的常用方法是使用一個擴大 窗口,這與所有的數據 產生可到這一點在統計數據的值時間

這些遵循與.rolling類似的界面,擴展的 方法返回一個展開對象。

由於這些計算的滾動統計的特殊情況,他們 在大熊貓實現,使得下面的兩個調用是 等價的:

In [96]: df.rolling(window=len(df), min_periods=1).mean()[:5] 
Out[96]: 
        A   B   C   D 
2000-01-01 0.314226 -0.001675 0.071823 0.892566 
2000-01-02 0.654522 -0.171495 0.179278 0.853361 
2000-01-03 0.708733 -0.064489 -0.238271 1.371111 
2000-01-04 0.987613 0.163472 -0.919693 1.566485 
2000-01-05 1.426971 0.288267 -1.358877 1.808650 

In [97]: df.expanding(min_periods=1).mean()[:5] 
Out[97]: 
        A   B   C   D 
2000-01-01 0.314226 -0.001675 0.071823 0.892566 
2000-01-02 0.654522 -0.171495 0.179278 0.853361 
2000-01-03 0.708733 -0.064489 -0.238271 1.371111 
2000-01-04 0.987613 0.163472 -0.919693 1.566485 
2000-01-05 1.426971 0.288267 -1.358877 1.808650 
+0

因此,它是與窗口全部滾動操作數據幀的長度。我不明白爲什麼需要爲此設置一個單獨的功能...... – wordsforthewise

+1

這實際上非常有用,因爲滾動操作是針對固定窗口大小的。但是,此操作是一個擴大的窗口大小。它從長度爲1的週期的「滾動」窗口開始,下一個窗口大小爲2個週期,然後是3,4,5等。對於流式數據,原始數據幀全長的滾動窗口將開始丟棄第一個幾個觀測值,而擴大的窗口允許您添加新的數據。 – Ryan