我有兩個包含從R導出的相關矩陣的.csv文件。一個文件包含P值,一個包含r值。行和列標題完全匹配這兩個文件。使用Python比較/從矩陣中提取數據(2.6.1)
我試圖提取r值和相應的行和列標題對只有當P值< 0.05。下面是樣品在什麼r值的輸入文件看起來像數據(I有1700+相關項,而不是僅示出兩個):
Species1 Species2
Species1 1 0.9
Species2 0.9 1
的P值的輸入文件是相同的,除了含有P值代替r值。
我對Python比較陌生,不確定如何處理這種類型的文件。我已經嘗試了一些策略,包括使用csv庫遍歷文件。我看着使用numpy,但它似乎並不適用於我(?)。我還研究過使用scipy來計算Python中的r值和P值(Pearsons),但似乎這隻適用於比較兩個一維數組(我有1700多列數據進行關聯)。
代碼我開始,向你展示我所輸入:
import csv
infileP = open('AllcorrP.csv', 'rU')
infileR = open('AllcorrR.csv', 'rU')
問題 誰能幫我提取我的r值文件中的列和行標題和r值基於重要的(< 0.05)我的p值文件中的P值?
OR
之間的數據的許多列直接使用Python和僅提取與顯著P值的結果計算出所有可能的相關R-和P值?
最後,我想輸出兩個文件。
第一個文件:
Species1 Species2 Species4 ...
Species2 Species1 Species7 ...
等...(其中「Species1」是顯著相關性和上線的下一個項目的第一個物種,它顯著與(Species2,Species4等)相關的種
第二文件:
Species1 (corr) Species2 = 0.87
Species2 (corr) Species7 = 0.72
...
等,其顯示每個成對相關和r值與它
去3210在這一點上,我很高興能夠提取我想要的r值和物種列表,並在稍後確定最終的兩個文件格式。謝謝!
謝謝! Numpy的確做得很好。我很抱歉不盡快給你寫信。 – python4ecology 2012-02-28 23:06:54