2012-03-28 80 views
1

我有這樣的芯片序列結果數據的26000個基因R中比較兩列密度圖

LncRNA_ID   LncRNA_Name  Control_Raw_TagCount ICLIP_EZH2_Raw_TagCount 
1  AK092525        47908     194887 
2 ENST00000423879 RP11-12M5.1    10794     90146 
3  AF318349        5514     61617 
4 ENST00000506392 CTC-313D10.1     288     40880 
5 ENST00000438080 RP11-177A2.4    25005     37380 
6  AK123756        800     35469 

矩陣我想繪製兩種樣品,控制和EZH2的數密度,也就是列3和4,以便比較它們。我使用R,我感到非常困惑,主要是因爲我不能將它們繪製爲直方圖,我得到一個只有一個小節的數字,而不是我正在等待的所有小節,如果我有興趣做一個boxplot 。可能是一個非常愚蠢的問題,但我有點絕望

ezh2<-data$ICLIP_EZH2_Raw_TagCount 
control<-data$Control_Raw_TagCount 
hist(ezh2)# not working, i can't see distribution at all 

你有什麼想法做到這一點嗎?

在此先感謝

+0

您能否包含您正在使用的代碼會導致您的問題? – 2012-03-28 23:04:57

+0

對齊在數據框中看起來有點偏離......可能這些列不被視爲數字,而是作爲因子變量存儲並帶有額外的空格。如果'is.numeric(數據$ ICLIP_EZH2_Raw_TagCount)'返回'FALSE',可能嘗試'as.numeric(as.character(data $ ICLIP_EZH2_Raw_TagCount))' – 2012-03-28 23:24:39

回答

0

箱線,其中兩列沿羣體粘在一起,然後分裂:

N  <- length(d$Control_Raw_TagCount) 
x  <- c(d$Control_Raw_TagCount, d$ICLIP_EZH2_Raw_TagCount) 
group <- rep(c("Control_Raw_TagCount", "ICLIP_EZH2_Raw_TagCount"), c(N, N)) 
boxplot(x ~ group) 

在這裏,我假設的數據名稱是d,這樣調整,要你的數據框的名字。如果你想要像空心直方圖(見OpenIntro Statistics pg26),在openintrohistPlot功能將使用參數probability=TRUE, hollow=TRUE做的伎倆:

# install.packages("openintro") 
library(openintro) 
histPlot(d$Control_Raw_TagCount, probability=TRUE, hollow=TRUE) 
histPlot(d$ICLIP_EZH2_Raw_TagCount, probability=TRUE, hollow=TRUE, 
     lty=3, border='red') 

如果垂直尺度是不正確的,添加一個ylim參數第一次撥打histPlot(例如ylim=c(0,0.05))。