之間的關係,我有以下大熊貓據幀Top15
: 使用.corr得到兩列
我創建估計每人可引用的文件數量列:
Top15['PopEst'] = Top15['Energy Supply']/Top15['Energy Supply per Capita']
Top15['Citable docs per Capita'] = Top15['Citable documents']/Top15['PopEst']
我想知道人均可接受文件數量與人均能源供應之間的關係。所以我用.corr()
方法(Pearson相關):
data = Top15[['Citable docs per Capita','Energy Supply per Capita']]
correlation = data.corr(method='pearson')
我想回到一個單一的數字,但結果是:
誰能幫助我?
我認爲你是對的。但是,你能告訴我爲什麼'data.corr(method ='pearson')'只返回能源供應和能源供應之間的關係嗎? –
它沒有。它應該返回給你一個2x2矩陣;你顯示它的左上角。如果將'.corr'直接應用於數據框,它將返回所有成對相關;這就是爲什麼你在矩陣的對角線上觀察1s(每列與自身完全相關)。看到我的編輯如下。 – Cleb
如果您認爲它已回答您的問題,請考慮[接受](http://meta.stackexchange.com/a/5235) – MaxU