是否可以在R data.tables中進行補充彙總。下面的例子。R,對數據彙總的補充。表
library(data.table)
dt <- data.table(a=c("word1","word2","word2","word2"), b=c("cat1","cat1","cat1","cat2"))
要獲得特定的詞數在一個類別
newdt <- dt[,(.N),by=.(a,b)]
#word1,cat1 - 1
#word2,cat1 - 2
#word2,cat2 - 1
我怎麼能指望在類別中的所有其它詞的數量?或者相關地,這個詞在其他類別中的數量?像下面這樣的東西?
#doesn't work
#newdt2 <- dt[a!=a,(.N),by=.(a,b)]
#the expected answer would be
#word1,cat1 - 2
#word2,cat1 - 1
#word2,cat2 - 0
我在網上教程或問題中找不到任何幫助。有沒有簡單的方法來獲得補充。 Data.table解決方案會很好,因爲使用50M行表。謝謝!
它不是明確要求 – akrun
是啊,我也有不知道的問題是什麼。另外,您的示例不可重現。你有沒有試過運行你自己的代碼? –
我不明白......不應該把'word2,cat2'變成2嗎? – Sotos