2015-11-03 86 views
2

我有一個數據幀df這樣的:平均直方圖按類別和情節置信區間

x series no 
1 24 u  3 
2 12 u  2 
3 23 v  1 
4 17 u  3 
5 5 v  2 
6 45 v  1 
7 18 u  3 
8 32 v  2 
9 34 u  1 
10 37 v  3 
... 

這裏,x是被測量的值,series是該系列測量屬於,no是多少在那個系列中。

我想看看x中值的分佈是如何在series之間變化的。

我可以簡單地過濾出每一個系列/ no自己並將它們繪製爲不同的線條。其結果是這樣的:

enter image description here

現在你可以看到,該系列u內,變化是在其他地方更在一些地方少。系列v也屬於這種情況。我想置信區間,顯示這一點,並獲得這樣的:

enter image description here

這裏棕色線是線U1,U2和U3的平均水平,粉紅色區域爲置信區間。同樣對於淺藍色,深藍色和v1,v2,v3。

當然,置信區間看起來會略有不同,因爲我不經意地計算出實際配置項,而是粗心地手工繪製了該配置項,但希望我的意圖清晰。

我該如何在R中完成這項工作?我可以做ggplot的情節嗎?

回答

0

第一張圖涉及兩個因素的分組,可以使用ggplot2進行繪圖。下面是使用R中的mpg數據集的一個示例。cty是一個數值變量,drvfl是兩個分類變量。

您必須先結合兩個因素。

library(dplyr) 
copy_mpg <- mpg 
copy_mpg <- select(mpg, cty, drv, fl) 
copy_mpg$df <- with(copy_mpg, interaction(drv, fl)) 

簡介: ggplot(copy_mpg, aes(hwy, col=df)) + geom_density() + theme_bw()

快捷方式:ggplot(copy_mpg, aes(hwy, col=interaction(drv, fl))) + geom_density() + theme_bw()

Plot 而對於第二部分,遵循this SO問題,this統計問題。