我怎樣才能以三個一組對行進行求和？

-1

我有這個數據，我想三個行的組合，1-3,4-6,7-9,10-12。在我的數據框中，我有48行和795個變量。你可以幫幫我嗎？我怎樣才能以三個一組對行進行求和？

我的數據幀：

 X1  X2  X3  X4  X5  X6  X7  X8  X9  
1  0.00  0.00 136.29 0.00 60.52 0.00  0.00 0.00 0.00 
2  0.00  0.00 4658.69 0.00 0.00 1749.50  0.00 0.00 0.00 
3  0.00  0.00 0.00 0.00 0.00 125.86  0.00 0.00 0.00 
4  0.00  0.00 119.34 0.00 0.00 0.00  0.00 0.00 0.00 
5  0.00  0.00 4674.16 2107.55 0.00 0.00  0.00 0.00 0.00 
6  0.00  0.00 0.00 0.00 0.00 5689.40  0.00 0.00 0.00 
7 4270.87  0.00 0.00 0.00 0.00 3275.74  0.00 0.00 0.00 
8  0.00 455.04 0.00 0.00 0.00 1296.30  0.00 0.00 0.00 
9  0.00  0.00 0.00 0.00 0.00 9887.52  0.00 0.00 0.00 
10 0.00  0.00 0.00 0.00 0.00 0.00  0.00 0.00 0.00 
11 0.00  0.00 0.00 0.00 2169.64 0.00  0.00 0.00 699.93 
12 0.00 12524.50 0.00 0.00 0.00 0.00  0.00 0.00 0.00

這是我想要的：

 X1  X2  X3  X4  X5  X6  X7  X8  X9 
1  0.00  0.00 ...... 
2  0.00  0.00 ...... 
3 4270.87 455.04 ...... 
4  0.00 12524.50 ......

來源

2016-11-24 Joan Triay

還參見'rowsum' - 'rowsum（數據，appropriate_grouping_vector） ' –

@alexis_laz不錯的一個，太簡單了！ 'rowsum（df1，rep（1：4，each = 3））'，考慮張貼爲答案。 – zx8754

@alexis_laz - 該死的......我總是忘記'rowsum' - 一個比我的更好的解決方案。 – thelatemail

使用filter基礎R溶液（這是stats::filter - 這dplyr bulldozes如果已經加載 - 提防）：

data.frame(lapply(df, function(x) filter(x, c(1,1,1), sides=1)[seq(3, nrow(df), 3)])) 
#  X1  X2  X3  X4  X5  X6 X7 X8  X9 
#1 0.00  0.00 4794.98 0.00 60.52 1875.36 0 0 0.00 
#2 0.00  0.00 4793.50 2107.55 0.00 5689.40 0 0 0.00 
#3 4270.87 455.04 0.00 0.00 0.00 14459.56 0 0 0.00 
#4 0.00 12524.50 0.00 0.00 2169.64  0.00 0 0 699.93

如@alexis_laz以上?rowsum筆記可能是優選的，因爲它爲它被明確定義目的，形式如下：

rowsum(data, appropriate_grouping_vector)

所以，像這樣的東西：

關於正行個

rowsum(dat, (1:nrow(dat) - 1) %/% 3) 
#  X1  X2  X3  X4  X5  X6 X7 X8  X9 
#0 0.00  0.00 4794.98 0.00 60.52 1875.36 0 0 0.00 
#1 0.00  0.00 4793.50 2107.55 0.00 5689.40 0 0 0.00 
#2 4270.87 455.04 0.00 0.00 0.00 14459.56 0 0 0.00 
#3 0.00 12524.50 0.00 0.00 2169.64  0.00 0 0 699.93

來源

2016-11-24 22:41:24 thelatemail

下面的代碼是一個dplyr溶液從其源（Summing columns on every nth row of a data frame in R）改性。

它通過創建一個索引變量來對行進行分組，然後將這些子集行的rowsums解決。 n可以取任何值，前提條件是nrow(df)可以被n整除。

df <- data.frame(runif(30), runif(30), runif(30)) 
library(plyr); library(dplyr) 

n <- 3 

df %>% 
    group_by(indx = gl(ceiling(nrow(df)/n), n, nrow(df))) %>% 
    summarise_each(funs(sum))

來源

2016-11-24 22:32:01

拆分數據，然後求和：

# dummy data 
df1 <- mtcars[1:12, 1:6] 

# split sum combine 
t(sapply(split(df1, rep(1:4, each = 3)), colSums))

來源

2016-11-24 22:41:50 zx8754

這也將工作：

df$group <- ceiling((1:nrow(df))/3) 
aggregate(. ~ group, data = df, sum)[-1] 

     X1  X2  X3  X4  X5  X6 X7 X8  X9 
1 0.00  0.00 4794.98 0.00 60.52 1875.36 0 0 0.00 
2 0.00  0.00 4793.50 2107.55 0.00 5689.40 0 0 0.00 
3 4270.87 455.04 0.00 0.00 0.00 14459.56 0 0 0.00 
4 0.00 12524.50 0.00 0.00 2169.64  0.00 0 0 699.93

來源

2016-11-25 05:50:12

我怎樣才能以三個一組對行進行求和？

回答

相關問題