我有一種新的含有得到的不同時間點測得的多個變量的數據幀在所選擇的列的含義(例如,test1_tp1
,test1_tp2
,test1_tp3
,test2_tp1
,test2_tp2
,...)。與行添加逐列使用dplyr
我現在試圖使用dplyr
向數據框中添加一個新列,以計算這些列的選擇(例如,所有時間點上的平均值爲test1
)上的行平均值。
- 即使用明確命名的列來計算平均值的語法,我仍然掙扎着。我嘗試沒有成功是:
data %>% ... %>% mutate(test1_mean = mean(test1_tp1, test1_tp2, test1_tp3, na.rm = TRUE)
- 我願進一步使用正則表達式/通配符選擇列名,所以像
data %>% ... %>% mutate(test1_mean = mean(matches("test1_.*"), na.rm = TRUE)
使用'橫行()'如答案爲[該SO問題](http://stackoverflow.com/questions/21818181/applying-a-function-to-every-row-of-描述一個表 - 使用-dplyr)。 – eipi10 2015-01-26 21:43:13
謝謝大家的好評!所有這些都是非常有用的...由於我沒有足夠的聲譽,我不能滿足你的答案,但只能選擇一個作爲解決方案,對不起! – user21932 2015-01-27 00:34:06
我強烈建議學習[tidy data](http://vita.had.co.nz/papers/tidy-data.html)。如果你的數據是一個整齊的格式,你會發現這種操作__much__更容易做 – hadley 2015-01-27 01:04:51