3
大熊貓文檔列出了一堆「擴窗函數」的:什麼是熊貓「擴大窗口」功能?
http://pandas.pydata.org/pandas-docs/version/0.17.0/api.html#standard-expanding-window-functions
但我無法弄清楚他們從文檔做什麼。
大熊貓文檔列出了一堆「擴窗函數」的:什麼是熊貓「擴大窗口」功能?
http://pandas.pydata.org/pandas-docs/version/0.17.0/api.html#standard-expanding-window-functions
但我無法弄清楚他們從文檔做什麼。
您可能需要閱讀this Pandas docs:
軋製統計的常用方法是使用一個擴大 窗口,這與所有的數據 產生可到這一點在統計數據的值時間。
這些遵循與.rolling類似的界面,擴展的 方法返回一個展開對象。
由於這些計算的滾動統計的特殊情況,他們 在大熊貓實現,使得下面的兩個調用是 等價的:
In [96]: df.rolling(window=len(df), min_periods=1).mean()[:5]
Out[96]:
A B C D
2000-01-01 0.314226 -0.001675 0.071823 0.892566
2000-01-02 0.654522 -0.171495 0.179278 0.853361
2000-01-03 0.708733 -0.064489 -0.238271 1.371111
2000-01-04 0.987613 0.163472 -0.919693 1.566485
2000-01-05 1.426971 0.288267 -1.358877 1.808650
In [97]: df.expanding(min_periods=1).mean()[:5]
Out[97]:
A B C D
2000-01-01 0.314226 -0.001675 0.071823 0.892566
2000-01-02 0.654522 -0.171495 0.179278 0.853361
2000-01-03 0.708733 -0.064489 -0.238271 1.371111
2000-01-04 0.987613 0.163472 -0.919693 1.566485
2000-01-05 1.426971 0.288267 -1.358877 1.808650
因此,它是與窗口全部滾動操作數據幀的長度。我不明白爲什麼需要爲此設置一個單獨的功能...... – wordsforthewise
這實際上非常有用,因爲滾動操作是針對固定窗口大小的。但是,此操作是一個擴大的窗口大小。它從長度爲1的週期的「滾動」窗口開始,下一個窗口大小爲2個週期,然後是3,4,5等。對於流式數據,原始數據幀全長的滾動窗口將開始丟棄第一個幾個觀測值,而擴大的窗口允許您添加新的數據。 – Ryan