我有兩個數據框,每列200列。爲了說明,我在這裏只使用3列。查找數據框中相應列的相關性
數據幀DF1爲:
A B C
1/4/2017 5 6 6
1/5/2017 5 2 1
1/6/2017 6 2 10
1/9/2017 1 9 10
1/10/2017 6 6 4
1/11/2017 6 1 1
1/12/2017 1 7 10
1/13/2017 8 9 6
數據幀DF2:
A D B
1/4/2017 8 10 2
1/5/2017 2 1 8
1/6/2017 6 6 6
1/9/2017 1 8 1
1/10/2017 10 6 2
1/11/2017 10 2 4
1/12/2017 5 4 10
1/13/2017 5 2 8
我要計算的下列相關矩陣爲df1
和df2
對應列:使用
A B
1/4/2017
1/5/2017
1/6/2017 0.19 -0.94
1/9/2017 0.79 -0.96
1/10/2017 0.90 -0.97
1/11/2017 1.00 -1.00
1/12/2017 1.00 0.42
1/13/2017 0.24 0.84
即追蹤同一列的3天曆史數據和df2
,我需要找到相關矩陣。
所以,我計算corr([5, 5, 6], [8, 2, 6]) = 0.19
其中[5,5,6]
是df1['A']
和[8,2,6]
爲df2['A']
因爲,我有200列,每列我發現它非常麻煩運行一個for循環兩次。首先循環遍歷列,然後使用尾隨3天滯後數據。
您可能會喜歡我發佈的第二個選項。 – piRSquared
@piRSquared看看,總是喜歡學習numpy的方法!! 1 – Wen