2017-10-11 122 views
-1

試圖將此數據框轉換爲比率矩陣,使2007年1月的A列等於2007年1月/ 2007年平均值,2007年2月將等於4/2007年平均值......需要應用於所有列。比率月份與年度平均值

YearM A B C 
2007/Jan 3 5 7 
2007/Feb 4 5 6 
2007/Mar 4 4 2 
........... 
2013/Dec 4 4 2 
+0

您可以使用'dput'發佈您的數據樣本嗎?您現在插入的樣本很難與 – bouncyball

+0

一起工作,只是想出瞭如何使用dput。 – jkl

+0

請不要忘記接受您發現最有用的答案,方法是點擊downvote按鈕 – useR

回答

2
library(dplyr) 

avg_mat = df %>% 
    group_by(year = sub("/.*", "", YearM)) %>% 
    mutate_at(vars(A:C), "mean") %>% 
    ungroup() %>% 
    select(A:C) %>% 
    as.matrix() 

mat = df %>% 
    select(A:C) %>% 
    as.matrix() 

cbind(YearM = df$YearM, as.data.frame(mat/avg_mat)) 

結果:

 YearM   A   B C 
1 2007/Jan 0.8181818 1.0714286 1.4 
2 2007/Feb 1.0909091 1.0714286 1.2 
3 2007/Mar 1.0909091 0.8571429 0.4 
4 2013/Dec 1.0000000 1.0000000 1.0 

數據:

df = read.table(text = "YearM A B C 
2007/Jan 3 5 7 
2007/Feb 4 5 6 
2007/Mar 4 4 2 
2013/Dec 4 4 2", header = TRUE) 
+0

下方的灰色複選標記,謝謝!任何方式將日期/月份添加回輸出矩陣? – jkl

+0

@jkl當然,看看我的更新。要添加'YearM',您必須將矩陣轉換爲data.frame,否則將被強制爲數字。 – useR

0

下面是一個使用sapplyave功能的另一種方式。 ave部分是從this post借來的。

df$year <- year = sub("/.*", "", df$YearM)  
df[,c('A','B','C')] <- df[,c('A','B','C')]/sapply(df[,c('A','B','C')], ave, df$year) 


    YearM   A   B C year 
1 2007/Jan 0.8181818 1.0714286 1.4 2007 
2 2007/Feb 1.0909091 1.0714286 1.2 2007 
3 2007/Mar 1.0909091 0.8571429 0.4 2007 
4 2013/Dec 1.0000000 1.0000000 1.0 2013