一個data.frame我想,我有一個數據幀上工作,但我在努力尋找一個名字和一個名稱相關聯的總和相關的最新日期。我的框架看起來是這樣的使用for循環變異r中
a<-
Date Name Sum
<date> <chr> <dbl>
23.02.2017 Johnny 6
24.02.2017 Jane 20
24.02.2017 Micky Mouse 20
27.02.2017 Jane 20
3.03.2017 Johnny 20
3.03.2017 Ronald 25
我想獲得這樣的
b<-
Latest Date Name Frequency Total Sum
<date> <chr> <dbl> <dbl>
3.03.2017 Johnny 2 26
27.02.2017 Jane 2 40
24.02.2017 Micky Mouse 1 20
3.03.2017 Ronald 1 25
我使用表函數,然後使用一個for循環開始,但我是一個有點菜鳥。
b <- data.frame(table(a$Name))
# after cleaning
b<-
Name Frequency
<chr> <int>
Johnny 2
Jane 2
Micky Mouse 1
Ronald 1
for (i in (a$Name)) {
b <- a %>%
mutate(Total Sum = sum(a$Sum[a$Name == i] %>%
mutate(Latest Date = max(a$date[a$Name == i]))
}
這將返回我看起來像這樣
b<-
Name Frequency Total Sum Latest Date
<chr> <int> <dbl> <date>
Johnny 2 40 27.02.2017
Jane 2 40 27.02.2017
Micky Mouse 1 40 27.02.2017
Ronald 1 40 27.02.2017
數據幀我怎樣才能確保總和僅僅是約翰尼,簡的同時,該日期爲與該名稱關聯的最新日期
'庫(dplyr); df%>%group_by(Name)%>%summarize(Total_Sum = sum(Sum),Latest_Date = max(Date))'應該有效。 – Axeman
另請參閱此處(https://stackoverflow.com/questions/1660124/how-to-sum-a-variable-by-group)。 – Axeman
美麗。謝謝! –