2017-08-28 41 views
0

我有診斷,年齡和數量。 例如,我如何在Weka中找到我的屬性的發生率?

enter image description here

我已經超過50歲以上有重複診斷。我希望在新的專欄中看到這個年齡+數量關係的發生率。我怎樣才能做到這一點 ?

+0

給定示例的預期輸出是多少?另外,請勿將圖像作爲輸入發佈,因爲它很難從中複製。 –

+0

對不起。那麼我試圖顯示診斷的年齡和數量的發病率。 – meltair

+0

你只需要'table(df $ Diagnose)'? –

回答

1

如果您的數據存儲在一個名爲df數據框,請嘗試以下操作:

library(dplyr) 
df %>% group_by(diagnosis, age, quatity) %>% summarise(n()) 

這會給你一個data.frame與出現的每個診斷的數量在一個特定的年齡和給定的「生化的」。請確保後者拼寫正確。

例如,使用mtcars數據集:

mtcars %>% group_by(cyl, vs, carb) %>% summarise(n()) 
Source: local data frame [11 x 4] 
Groups: cyl, vs [?] 

    cyl vs carb `n()` 
    <dbl> <dbl> <dbl> <int> 
1  4  0  2  1 
2  4  1  1  5 
3  4  1  2  5 
4  6  0  4  2 
5  6  0  6  1 
6  6  1  1  2 
7  6  1  4  2 
8  8  0  2  4 
9  8  0  3  3 
10  8  0  4  6 
11  8  0  8  1 

這裏,第一行告訴你,只有一個車cyl = 4, vs = 0, carb = 2,並有5輛汽車行駛(cyl, vs, carb) = (4, 1, 1)。如果要將列添加到舊的data.frame,請使用mutate而不是summarise

這些操作通常被稱爲split-apply-combine。閱讀它們是值得的。


僅供參考:「我如何才能找到我的R或Weka中的屬性的發病率」這個問題曾經是隻有在我爲R提供了答案之後,它才被更改爲Weka。

+0

謝謝。任何機會我可以在Weka中獲得相同的結果? – meltair

+0

另外,如何消除重複診斷? – meltair

+0

我對「Weka」一無所知,但如果你無法達到同樣的效果,我會感到驚訝。如果您按照上面所述使用'summarise',則輸出中不會有重複項。 – coffeinjunky

相關問題