我如何在Weka中找到我的屬性的發生率？

我已經超過50歲以上有重複診斷。我希望在新的專欄中看到這個年齡+數量關係的發生率。我怎樣才能做到這一點？

2017-08-28 meltair

給定示例的預期輸出是多少？另外，請勿將圖像作爲輸入發佈，因爲它很難從中複製。 –

對不起。那麼我試圖顯示診斷的年齡和數量的發病率。 – meltair

你只需要'table（df $ Diagnose）'？ –

如果您的數據存儲在一個名爲df數據框，請嘗試以下操作：

library(dplyr) 
df %>% group_by(diagnosis, age, quatity) %>% summarise(n())

這會給你一個data.frame與出現的每個診斷的數量在一個特定的年齡和給定的「生化的」。請確保後者拼寫正確。

例如，使用mtcars數據集：

mtcars %>% group_by(cyl, vs, carb) %>% summarise(n()) 
Source: local data frame [11 x 4] 
Groups: cyl, vs [?] 

    cyl vs carb `n()` 
    <dbl> <dbl> <dbl> <int> 
1  4  0  2  1 
2  4  1  1  5 
3  4  1  2  5 
4  6  0  4  2 
5  6  0  6  1 
6  6  1  1  2 
7  6  1  4  2 
8  8  0  2  4 
9  8  0  3  3 
10  8  0  4  6 
11  8  0  8  1

這裏，第一行告訴你，只有一個車cyl = 4, vs = 0, carb = 2，並有5輛汽車行駛(cyl, vs, carb) = (4, 1, 1)。如果要將列添加到舊的data.frame，請使用mutate而不是summarise。

這些操作通常被稱爲split-apply-combine。閱讀它們是值得的。

僅供參考：「我如何才能找到我的R或Weka中的屬性的發病率」這個問題曾經是隻有在我爲R提供了答案之後，它才被更改爲Weka。

來源

2017-08-28 08:33:20 coffeinjunky

謝謝。任何機會我可以在Weka中獲得相同的結果？ – meltair

另外，如何消除重複診斷？ – meltair

我對「Weka」一無所知，但如果你無法達到同樣的效果，我會感到驚訝。如果您按照上面所述使用'summarise'，則輸出中不會有重複項。 – coffeinjunky

我如何在Weka中找到我的屬性的發生率？

回答

相關問題