R語言中的SQL窗口函數

我想用R語言解決在postgresSQL中編寫的窗口函數。R語言中的SQL窗口函數

據我所知，R有aggregate()來計算分組數據。是否有任何庫支持窗口功能？

2012-12-10 Vinoth S

嗨。你需要一個例子來展示你用window postegre sql函數做了什麼。 – agstudy

如果您熟悉SQL語法，則可以使用aggregate和merge。服用example from the PostgreSQL manual之一，我們將使用

empsalary <- data.frame(depname=rep(c("develop", "personnel", "sales"), c(5, 2, 3)), 
         empno=c(11, 7, 9, 8, 10, 5, 2, 3, 1, 4), 
         salary=c(5200, 4200, 4500, 6000, 5200, 3500, 3900, 4800, 5000, 4800)) 
merge(empsalary, aggregate(salary ~ depname, empsalary, mean), by="depname")

再現第一實施例（通過depname計算平均工資）。

 depname empno salary.x salary.y 
1 develop 11  5200 5020.000 
2 develop  7  4200 5020.000 
3 develop  9  4500 5020.000 
4 develop  8  6000 5020.000 
5 develop 10  5200 5020.000 
6 personnel  5  3500 3700.000 
7 personnel  2  3900 3700.000 
8  sales  3  4800 4866.667 
9  sales  1  5000 4866.667 
10  sales  4  4800 4866.667

您可能想要看看plyr必須提供更詳細的結構。

來源

2012-12-10 10:31:59 chl

正確，上面的解決方案創建一個新的data.frame。你也可以模擬合併，如下所示：'m < - with（empsalary，rep（tapply（salary，depname，mean），table（depname）））''，'cbind'在你的原始data.frame中生成的向量。例如，對於平均PERC。的工資，我們可以使用'empsalary $ avg.perc < - empsalary $ salary/m * 100'。 – chl

謝謝你的回覆。假設我想用R語言解決以下查詢： SELECT depname，empno，（salary * avg（salary）OVER（PARTITION BY depname））* 100，（cost * avg（cost）OVER（PARTITION BY depname））* 100 FROM empsalary 然後，我是否需要編寫一個單獨的合併併爲每個窗口函數創建一個臨時數據框併合並所有最終結果..？ –

不是。您可以使用我提出的建議（按組計算均值並按行擴展，然後將其作爲新列添加到您的data.frame中）;您只需添加第二個聚合步驟，用'cost'替換'salary'。（順便說一句，*不要刪除您的評論*，否則未來的讀者將無法關注對話。） – chl

R語言中的SQL窗口函數

回答

相關問題