在R中,我有一個大型數據框的列表,其中包含兩列,分別爲value
和count
。我在前面的步驟中使用的函數返回value
中的觀察值,相應的列count
顯示了觀察到該特定值的次數。以下代碼生成一個數據幀爲例 - 但是列表中的所有數據幀都具有不同的值,值範圍:彙總來自值和計數屬性的數據
d <- as.data.frame(
cbind(
value = runif(n = 1856, min = 921, max = 4187),
count = runif(n = 1856, min = 0, max = 20000)
)
)
現在我想彙總數據以便能夠創建可查看的可視化。此聚合應該應用於列表中的所有數據幀,每個數據幀具有不同的值範圍。我正在尋找一種功能,將數據切割成新的值和計數,有點像直方圖函數。因此,例如,對於所有數值爲0到100的數值,計數應該加總(等等,在定義的時間間隔內,乾淨的間隔邊界起點像0)。
我的第一個嘗試是創建一個簡單的值向量,其中每個值都重複了多次,由count
字段確定。然後,下一步將應用hist()
函數而不繪製以獲得可以在hist()
的論點中定義的聚合值和計數。但是,這會產生太大的向量(每個有一些Gb),R無法再處理。我很欣賞任何解決方案或提示!