2017-10-05 110 views
0

我正在嘗試整合我的數據框中的重複行並計算與重複對應的其他行。合併數據幀計數

Consolidate duplicate rows

這個線程是非常有益的,但是當我在ddply方法與次數,而不是試圖總和的功能我得到的錯誤:長度(行)== 1是不正確的。

ACCT_NUM    DC_NUM INVOICE_NUM  DATE DC_PROD_ NUM DELIVERED_QUANTITY               
640324  CCF575-000712116   15283 4-May-15  154609 1  29147104 
640324  CCF575-000712116   15283 4-May-15  423580 1  29147104 
640324  CCF575-000712116   15283 4-May-15  538010 1  29147104 
640324  CCF575-000712116   15283 4-May-15  991900 1  29147104 
640324  CCF575-000712116   15283 4-May-15  991940 1  29147104 
640324  CCF575-000712116   15283 4-May-15  991960 1  29147104 
640324  CCF575-000712116   29289 7-May-15  423580 1  29181744 
+0

嘗試'length',而不是'count'。 'plyr :: count'被構建用於整個數據框,而不僅僅是一列。 – Gregor

+0

示例數據?期望的輸出? – User632716

+0

請您考慮這些建議[問題](https://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example) – shea

回答

0

我認爲你正在尋找dplyr::n()而非count功能。

有了這些數據:

df <- data.frame(A = c("A","A","B","B") 
        , B = c("C", "C", "D", "D")) 

你可以抓住這樣的計數:

df %>% 
    group_by(A, B) %>% 
    summarise(Count = n()) 

返回:

 A  B Count 
    <fctr> <fctr> <int> 
1  A  C  2 
2  B  D  2