我最後一個問題的答案幫助我瞭解dplyr
n()
。但我仍然無法適用於我想解決的問題。所以,我在這裏發佈數據和實際問題。數據如下所示計算多個欄和組在R
finalCalledPartyNumber Call Day Call Date Block Answered Call Duration Opty ID Opty Created Date BC ID
19183598259 Monday 2016-12-05 12:26:46 Block 2(12:30 pm) 1 5 1234 <NA> <NA>
17135796188 Monday 2016-12-05 12:18:24 Block 2(12:30 pm) 1 16 <NA> <NA> 3456
19183598259 Monday 2016-12-05 15:43:33 Block 4(5:30 pm) 1 10 <NA> <NA> 4567
17135796188 Tuesday 2016-12-06 11:53:50 Block 2(12:30 pm) 1 85 <NA> <NA> 5566
19014741000 Tuesday 2016-12-06 12:00:11 Block 2(12:30 pm) 1 42 6789 <NA> <NA>
19014741000 Tuesday 2016-12-06 10:43:20 Block 2(12:30 pm) 1 58 2345 <NA> <NA>
BC Created Date
<NA>
<NA>
<NA>
<NA>
<NA>
<NA>
對於每個finalCalledPartyNumber
,我要計算次,每次finallCalledPartyNumber
叫的Opty ID
和BC ID
數量,數量。該數據集是巨大的,並且<NA>
只是意味着沒有Opty ID
或BC ID
被創建。
輸出:
finalCalledPartyNumber n_opty n_BC n_calls
19183598259 1 1 2
17135796188 0 2 2
19014741000 2 0 2
我感謝你的幫助。謝謝。
如果你沒有你想要排除的NULL,'count'並不需要一個參數:你可以用'count(1)'替換count([finalCalledPartyNumber])'。所以'n()'在這裏應該很好,如果你有空值,就把它們過濾掉。 – HubertL
[請重現例子](https://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example) – Masoud