試圖在一個矩陣來計算特定基因(這裏其基因1)與所有其它(35999個候選)的相關性一到以矩陣許多相關計算中的R
samp1 samp2 samp3 samp4
Gene 1 3.7891 2.4487 1.1939 0.6013
Gene 2 1.4484 3.2316 2.841 1.9545
Gene 3 0.4505 2.6062 2.0729 0.6403
.
.
Gene 36000 1.8828 5.2633 2.7552 1.7335
我用下面的代碼
library(Hmisc)
A <- read.table("C:/Users/Desktop/exp.txt", header=T, sep="\t")
cor <- rcorr(as.matrix(A), type="pearson")
write.csv(cor$r,'C:/Users/Desktop/pCC VALUES.csv')
write.csv(cor$P,'C:/Users/Desktop/p VALUES.csv')
但上面的代碼是矩陣計算36000 * 36000。但是,我想獲得一對多相關性,其中感興趣的基因始終是第一個基因。這裏它的基因1.這將節省處理時間。一種方法顯然是從輸出中提取36000對我的興趣。我想知道是否有其他方法可以找到我的基因與其他所有其他方法的相關性,而不需要多對多的計算。
編輯:
我正在尋找類似的格式輸出,
Gene 1 Gene 2 pcc p-value
Gene 1 Gene 3 pcc p-value
.
.
Gene 1 Gene 36000 pcc p-value
end
您能否在此背景下澄清一對多含義?您想要將Gene1的4個樣本與4個樣本的35999個其他組相關聯,一次一個?如果是這樣,則不存在1對1的樣本,這是35999個一對一樣本。但也許我是誤解。 –
@DominicComtois我同意使用'一對多'的術語令人困惑。我編輯了帖子並添加了我正在尋找的輸出格式。與上面的代碼預期幾乎相同的結果,但它應該僅限於基因1的PCC對。 – Donjin