獲得在矩陣

兩個分類的比例予有諸如數據矩陣（MYDATA的）：獲得在矩陣

 L SCORE 
[1,] "nL" 1     
[2,] "nL" 4     
[3,] "L" 4     
[4,] "L" 4     
[5,] "nL" 3     
[6,] "nL" 9 
... 
...

等。

我希望得到關於分數的「L」和「nL」個案。目標輸出將如下所示：

 SCORE LCount nLCount 
[1,] 1  0  1 
[2,] 4  2  1 
[3,] 3  0  1    
[4,] 9  0  1 
...

我該如何實現這一目標？我嘗試使用表（myData），但這不會產生所需的結果（我得到一個計數基於分數，但沒有分離爲「L」和「nL」）。我感覺我在這裏錯過了一些相當微不足道的東西。如何獲得「L」和「nL」的計數？目前，myData是一個（相當大的）矩陣，並且由於內存問題，如果可能的話，我想避免將其轉換。

來源

2015-04-05 Ruslan

非常好問題！ – 2015-04-05 08:39:17

好的，找到答案，畢竟它是table（）。簡單使用：

table(myData[,1], myData[,2])

viola。

-Ruslan

來源

2015-04-05 08:25:58 Ruslan

只是'table（myData）'將在這種情況下。 – 2015-04-05 08:44:48

只是表格返回類似於：[1 3 4 9 L nL] [1 1 3 1 2 4] – Ruslan 2015-04-05 12:51:40

您還可以使用data.table（記得矩陣是一個類型，這樣你的初始矩陣僅僅是全字符）：

library(data.table) 
library(reshape2) 

dcast(setDT(as.data.frame(m))[,.(count=.N),.(SCORE, L)], SCORE~L, value.var='count') 
# SCORE L nL 
#1  1 NA 1 
#2  3 NA 1 
#3  4 2 1 
#4  9 NA 1

數據

m=structure(c("nL", "nL", "L", "L", "nL", "nL", "1", "4", "4", 
"4", "3", "9"), .Dim = c(6L, 2L), .Dimnames = list(NULL, c("L", 
"SCORE")))

來源

2015-04-05 08:37:37

謝謝，我會牢記以備將來參考 – Ruslan 2015-04-05 10:42:27

（現在我更喜歡不需要更改的解決方案數據類型，因爲在這種情況下數據類型很大） – Ruslan 2015-04-05 10:50:24

哈，我永遠不會強迫某人使用我的解決方案！桌子在那裏更加優雅！ – 2015-04-05 10:58:34

回答

相關問題