平均直方圖按類別和情節置信區間

x series no 
1 24 u  3 
2 12 u  2 
3 23 v  1 
4 17 u  3 
5 5 v  2 
6 45 v  1 
7 18 u  3 
8 32 v  2 
9 34 u  1 
10 37 v  3 
...

這裏，x是被測量的值，series是該系列測量屬於，no是多少在那個系列中。

我想看看x中值的分佈是如何在series之間變化的。

我可以簡單地過濾出每一個系列/ no自己並將它們繪製爲不同的線條。其結果是這樣的：

現在你可以看到，該系列u內，變化是在其他地方更在一些地方少。系列v也屬於這種情況。我想置信區間，顯示這一點，並獲得這樣的：

這裏棕色線是線U1，U2和U3的平均水平，粉紅色區域爲置信區間。同樣對於淺藍色，深藍色和v1，v2，v3。

當然，置信區間看起來會略有不同，因爲我不經意地計算出實際配置項，而是粗心地手工繪製了該配置項，但希望我的意圖清晰。

我該如何在R中完成這項工作？我可以做ggplot的情節嗎？

2015-11-03 Superbest

第一張圖涉及兩個因素的分組，可以使用ggplot2進行繪圖。下面是使用R中的mpg數據集的一個示例。cty是一個數值變量，drv和fl是兩個分類變量。

您必須先結合兩個因素。

library(dplyr) 
copy_mpg <- mpg 
copy_mpg <- select(mpg, cty, drv, fl) 
copy_mpg$df <- with(copy_mpg, interaction(drv, fl))

簡介： ggplot(copy_mpg, aes(hwy, col=df)) + geom_density() + theme_bw()

快捷方式：ggplot(copy_mpg, aes(hwy, col=interaction(drv, fl))) + geom_density() + theme_bw()

而對於第二部分，遵循this SO問題，this統計問題。

2015-11-04 02:11:46

回答