執行子組內聚合計算

我想計算'組內配額using the bottom N`的值。我已經閱讀了幾個例子here，它解釋了很多不同的計算方法，但我沒有完全理解它們（有些不是特定於Postgresql的）。我用下表來說明我的問題：執行子組內聚合計算

a | b | x 
    ---|---|------ 
    1 | 1 | 10.00 
    1 | 2 | 15.00 
    1 | 1 | 10.00 
    1 | 2 | 15.00 
    2 | 2 | 20.00 
    2 | 1 | 21.00 
    2 | 2 | 18.00

SQL創建表：

CREATE TABLE test(a int,b int,x decimal(6,2)); 
INSERT INTO test VALUES(1,1,10),(1,2,15), (1,1,10), (1,2,15), (2,2,20),(2,1,21),(2,2,18);

我希望能夠計算最小的最低N值，每個組。在這個例子中，我讓N = 2。我曾嘗試的第一步是：

SELECT 
    t1.a, 
    AVG(t1.x) as avg_x 
FROM 
    test AS t1 
GROUP BY t1.a 
ORDER BY avg_x

a | avg_x 
--|------ 
1 | 12.50 
2 | 19.66

我試着做（這給了不正確的結果）是使一個子查詢，並限制結果數：

SELECT foo.* FROM 
(SELECT 
    t1.a, 
    AVG(t1.x) as avg_x 
FROM 
    test AS t1 
GROUP BY t1.a 
ORDER BY avg_x 
) as foo 
ORDER BY foo.avg_x 
LIMIT 2

我知道這是不正確的，因爲它沒有使用LIMIT每個子組。爲了澄清，我想返回的表是：

a | avg_x 
--|------ 
1 | 10.00 
2 | 19.00

的原始結果爲a=1是x = 10.0, 10.0, 21，平均數值10.0, 10.0的。

來源

2012-02-26 djq

我有點困惑。從最初的表格中，您要查找的預期結果（作爲表格）是什麼？ – 2012-02-26 23:58:38

還有一件事，主要關鍵是什麼？ – 2012-02-27 00:09:37

抱歉，由於缺乏清晰度 - 我試圖再次重新解釋這一點。在這個例子中，我沒有使用主鍵。 – djq 2012-02-27 00:11:04

我敢肯定，這將在PostgreSQL的工作：

WITH T AS (
    SELECT A.*, ROW_NUMBER() OVER(PARTITION BY a ORDER BY x) AS rnk 
    FROM @yourTable AS A 
) 
SELECT a, AVG(x) avg_lowest_n_values 
FROM T 
WHERE rnk <= 2 
GROUP BY a;

來源

2012-02-27 00:06:25

'b'先，然後'a'。那有意義嗎？你的解決方案確實可以用數字方式工作（我只是試圖圍繞語法來包裝我的頭）。 – djq 2012-02-27 00:22:18

@celenius - 你是由'b'然後'a'分組？（a = 1，b = 1），（a = 1，b = 2），（a = 2，b = 1），（a = 2，b = 2）。 – 2012-02-27 00:26:10

你是對的....我只是意識到這一點。我只是用'a'分組，實際上並沒有考慮到'b'的值。我會重新編輯我的問題。 – djq 2012-02-27 00:29:53

SELECT t1.a, round(AVG(t1.x), 2) as avg_x 
FROM (SELECT * 
    FROM test t2 
    WHERE x in (select x 
       from test t3 
       where t3.a = t2.a 
       order by x 
       limit 2)) as t1 
GROUP BY t1.a 
ORDER BY avg_x

結果：

a | avg_x 
--+------- 
1 | 10.00 
2 | 19.00

如果我理解正確你的問題。

來源

2012-02-27 00:37:22 Isaac

執行子組內聚合計算

回答

相關問題