我正在嘗試獲取前一週的輸入的相關值到下一週的輸出。如何抵消熊貓皮爾遜與日期時間索引的相關性
爲了這個例子我已經設置了它,每週的輸入是下一週的輸出,df.corr()
應該給出1.000000
的結果。
我原來的數據是這樣的:在這裏上傳
Date Input Output
1/1/2010 73 73
1/7/2010 2 73
1/13/2010 3 2
1/19/2010 4 3
全樣本數據: https://drive.google.com/open?id=0B4xdnV0LFZI1MzRUOUJkcUY4ajQ
這裏是到目前爲止我的代碼:
import pandas as pd
df = pd.read_csv('pearson.csv')
df['Date'] = pd.to_datetime(df['Date'], errors = 'coerce')
df = df.set_index(pd.DatetimeIndex(df['Date']))
df = df[['Input', 'Output']]
x = df.corr(method = 'pearson', min_periods=1)
print(x)
而作爲一個新手在這裏就是我卡住了。我沒有看到該函數中內置的shift
選項,並且不知道如何執行此操作。
任何和所有的幫助表示讚賞。
謝謝你,我
BTW這是每6天。 – piRSquared