📣

TiDB Cloud Essential 开放公测中。此页面由 AI 自动翻译，英文原文请见此处。

窗口函数

TiDB 中窗口函数的用法与 MySQL 8.0 类似。详情请参见 MySQL Window Functions。

在 TiDB 中，你可以通过以下系统变量控制窗口函数：

tidb_enable_window_function：由于窗口函数在解析器中保留了额外的关键字，TiDB 提供了该变量用于禁用窗口函数。如果你在升级 TiDB 后解析 SQL 语句时遇到错误，可以尝试将该变量设置为 OFF。
tidb_enable_pipelined_window_function：你可以使用该变量禁用窗口函数的流水线执行算法。
windowing_use_high_precision：你可以使用该变量禁用窗口函数的高精度模式。

此处列出的窗口函数可以下推到 TiFlash。

除了 GROUP_CONCAT() 和 APPROX_PERCENTILE() 之外，TiDB 支持将所有 GROUP BY 聚合函数作为窗口函数使用。此外，TiDB 还支持以下窗口函数：

函数名	功能描述
`CUME_DIST()`	返回某个值在一组值中的累积分布。
`DENSE_RANK()`	返回当前行在分区中的排名，且排名之间没有间隔。
`FIRST_VALUE()`	返回当前窗口中第一行的表达式值。
`LAG()`	返回分区内当前行之前第 N 行的表达式值。
`LAST_VALUE()`	返回当前窗口中最后一行的表达式值。
`LEAD()`	返回分区内当前行之后第 N 行的表达式值。
`NTH_VALUE()`	返回当前窗口中第 N 行的表达式值。
`NTILE()`	将分区划分为 N 个桶，为分区内每一行分配桶编号，并返回当前行所在的桶编号。
`PERCENT_RANK()`	返回分区中小于当前行值的值所占的百分比。
`RANK()`	返回当前行在分区中的排名，排名可能存在间隔。
`ROW_NUMBER()`	返回当前行在分区中的行号。

`CUME_DIST()`

CUME_DIST() 计算某个值在一组值中的累积分布。注意，你需要配合 ORDER BY 子句一起使用 CUME_DIST() 对值进行排序，否则该函数不会返回预期的结果。

WITH RECURSIVE cte(n) AS (
    SELECT 1
    UNION
    SELECT
        n+2
    FROM
        cte
    WHERE
        n<6
)
SELECT
    *,
    CUME_DIST() OVER(ORDER BY n)
FROM
    cte;

+------+------------------------------+
| n    | CUME_DIST() OVER(ORDER BY n) |
+------+------------------------------+
|    1 |                         0.25 |
|    3 |                          0.5 |
|    5 |                         0.75 |
|    7 |                            1 |
+------+------------------------------+
4 rows in set (0.00 sec)

`DENSE_RANK()`

DENSE_RANK() 函数返回当前行的排名。它与 RANK() 类似，但在遇到并列（具有相同值和排序条件的行）时不会产生间隔。

SELECT
    *,
    DENSE_RANK() OVER (ORDER BY n)
FROM (
    SELECT 5 AS 'n'
    UNION ALL
    SELECT 8
    UNION ALL
    SELECT 5
    UNION ALL
    SELECT 30
    UNION ALL
    SELECT 31
    UNION ALL
    SELECT 32) a;

+----+--------------------------------+
| n  | DENSE_RANK() OVER (ORDER BY n) |
+----+--------------------------------+
|  5 |                              1 |
|  5 |                              1 |
|  8 |                              2 |
| 30 |                              3 |
| 31 |                              4 |
| 32 |                              5 |
+----+--------------------------------+
6 rows in set (0.00 sec)

`FIRST_VALUE()`

FIRST_VALUE(expr) 返回窗口中的第一个值。

以下示例使用了两种不同的窗口定义：

PARTITION BY n MOD 2 ORDER BY n 将表 a 中的数据分为两组：1, 3 和 2, 4，因此分别返回 1 或 2，即各组的第一个值。
PARTITION BY n <= 2 ORDER BY n 将表 a 中的数据分为两组：1, 2 和 3, 4，因此分别返回 1 或 3，取决于 n 属于哪一组。

SELECT
    n,
    FIRST_VALUE(n) OVER (PARTITION BY n MOD 2 ORDER BY n),
    FIRST_VALUE(n) OVER (PARTITION BY n <= 2 ORDER BY n)
FROM (
    SELECT 1 AS 'n'
    UNION
    SELECT 2
    UNION
    SELECT 3
    UNION
    SELECT 4
) a
ORDER BY
    n;

+------+-------------------------------------------------------+------------------------------------------------------+
| n    | FIRST_VALUE(n) OVER (PARTITION BY n MOD 2 ORDER BY n) | FIRST_VALUE(n) OVER (PARTITION BY n <= 2 ORDER BY n) |
+------+-------------------------------------------------------+------------------------------------------------------+
|    1 |                                                     1 |                                                    1 |
|    2 |                                                     2 |                                                    1 |
|    3 |                                                     1 |                                                    3 |
|    4 |                                                     2 |                                                    3 |
+------+-------------------------------------------------------+------------------------------------------------------+
4 rows in set (0.00 sec)

`LAG()`

LAG(expr [, num [, default]]) 函数返回分区内当前行之前第 num 行的 expr 值。如果该行不存在，则返回 default。如果未指定，num 默认为 1，default 默认为 NULL。

在以下示例中，由于未指定 num，LAG(n) 返回上一行的 n 值。当 n 为 1 时，由于上一行不存在且未指定 default，LAG(1) 返回 NULL。

WITH RECURSIVE cte(n) AS (
    SELECT 1
    UNION
    SELECT
        n+1
    FROM
        cte
    WHERE
        n<10
)
SELECT
    n,
    LAG(n) OVER ()
FROM
    cte;

+------+----------------+
| n    | LAG(n) OVER () |
+------+----------------+
|    1 |           NULL |
|    2 |              1 |
|    3 |              2 |
|    4 |              3 |
|    5 |              4 |
|    6 |              5 |
|    7 |              6 |
|    8 |              7 |
|    9 |              8 |
|   10 |              9 |
+------+----------------+
10 rows in set (0.01 sec)

`LAST_VALUE()`

LAST_VALUE() 函数返回窗口中的最后一个值。

WITH RECURSIVE cte(n) AS (
    SELECT
        1
    UNION
    SELECT
        n+1
    FROM
        cte
    WHERE
        n<10
)
SELECT
    n,
    LAST_VALUE(n) OVER (PARTITION BY n<=5)
FROM
    cte
ORDER BY
    n;

+------+----------------------------------------+
| n    | LAST_VALUE(n) OVER (PARTITION BY n<=5) |
+------+----------------------------------------+
|    1 |                                      5 |
|    2 |                                      5 |
|    3 |                                      5 |
|    4 |                                      5 |
|    5 |                                      5 |
|    6 |                                     10 |
|    7 |                                     10 |
|    8 |                                     10 |
|    9 |                                     10 |
|   10 |                                     10 |
+------+----------------------------------------+
10 rows in set (0.00 sec)

`LEAD()`

LEAD(expr [, num [,default]]) 函数返回分区内当前行之后第 num 行的 expr 值。如果该行不存在，则返回 default。如果未指定，num 默认为 1，default 默认为 NULL。

在以下示例中，由于未指定 num，LEAD(n) 返回当前行之后一行的 n 值。当 n 为 10 时，由于下一行不存在且未指定 default，LEAD(10) 返回 NULL。

WITH RECURSIVE cte(n) AS (
    SELECT
        1
    UNION
    SELECT
        n+1
    FROM
        cte
    WHERE
        n<10
)
SELECT
    n,
    LEAD(n) OVER ()
FROM
    cte;

+------+-----------------+
| n    | LEAD(n) OVER () |
+------+-----------------+
|    1 |               2 |
|    2 |               3 |
|    3 |               4 |
|    4 |               5 |
|    5 |               6 |
|    6 |               7 |
|    7 |               8 |
|    8 |               9 |
|    9 |              10 |
|   10 |            NULL |
+------+-----------------+
10 rows in set (0.00 sec)

`NTH_VALUE()`

NTH_VALUE(expr, n) 函数返回窗口中第 n 个值。

WITH RECURSIVE cte(n) AS (
    SELECT
        1
    UNION
    SELECT
        n+1
    FROM
        cte
    WHERE
        n<10
)
SELECT
    n,
    FIRST_VALUE(n) OVER w AS 'First',
    NTH_VALUE(n, 2) OVER w AS 'Second',
    NTH_VALUE(n, 3) OVER w AS 'Third',
    LAST_VALUE(n) OVER w AS 'Last'
FROM
    cte
WINDOW
    w AS (PARTITION BY n<=5)
ORDER BY
    n;

+------+-------+--------+-------+------+
| n    | First | Second | Third | Last |
+------+-------+--------+-------+------+
|    1 |     1 |      2 |     3 |    5 |
|    2 |     1 |      2 |     3 |    5 |
|    3 |     1 |      2 |     3 |    5 |
|    4 |     1 |      2 |     3 |    5 |
|    5 |     1 |      2 |     3 |    5 |
|    6 |     6 |      7 |     8 |   10 |
|    7 |     6 |      7 |     8 |   10 |
|    8 |     6 |      7 |     8 |   10 |
|    9 |     6 |      7 |     8 |   10 |
|   10 |     6 |      7 |     8 |   10 |
+------+-------+--------+-------+------+
10 rows in set (0.00 sec)

`NTILE()`

NTILE(n) 函数将窗口划分为 n 组，并返回每一行所在的组号。

WITH RECURSIVE cte(n) AS (
    SELECT
        1
    UNION
    SELECT
        n+1
    FROM
        cte
    WHERE
    n<10
)
SELECT
    n,
    NTILE(5) OVER (),
    NTILE(2) OVER ()
FROM
    cte;

+------+------------------+------------------+
| n    | NTILE(5) OVER () | NTILE(2) OVER () |
+------+------------------+------------------+
|    1 |                1 |                1 |
|    2 |                1 |                1 |
|    3 |                2 |                1 |
|    4 |                2 |                1 |
|    5 |                3 |                1 |
|    6 |                3 |                2 |
|    7 |                4 |                2 |
|    8 |                4 |                2 |
|    9 |                5 |                2 |
|   10 |                5 |                2 |
+------+------------------+------------------+
10 rows in set (0.00 sec)

`PERCENT_RANK()`

PERCENT_RANK() 函数返回一个介于 0 和 1 之间的数字，表示小于当前行值的行所占的百分比。

SELECT
    *,
    PERCENT_RANK() OVER (ORDER BY n),
    PERCENT_RANK() OVER (ORDER BY n DESC)
FROM (
    SELECT 5 AS 'n'
    UNION ALL
    SELECT 8
    UNION ALL
    SELECT 5
    UNION ALL
    SELECT 30
    UNION ALL
    SELECT 31
    UNION ALL
    SELECT 32) a;

+----+----------------------------------+---------------------------------------+
| n  | PERCENT_RANK() OVER (ORDER BY n) | PERCENT_RANK() OVER (ORDER BY n DESC) |
+----+----------------------------------+---------------------------------------+
|  5 |                                0 |                                   0.8 |
|  5 |                                0 |                                   0.8 |
|  8 |                              0.4 |                                   0.6 |
| 30 |                              0.6 |                                   0.4 |
| 31 |                              0.8 |                                   0.2 |
| 32 |                                1 |                                     0 |
+----+----------------------------------+---------------------------------------+
6 rows in set (0.00 sec)

`RANK()`

RANK() 函数与 DENSE_RANK() 类似，但在遇到并列（具有相同值和排序条件的行）时会产生间隔。这意味着它提供的是绝对排名。例如，排名为 7 表示有 6 行排名更低。

SELECT
    *,
    RANK() OVER (ORDER BY n),
    DENSE_RANK() OVER (ORDER BY n)
FROM (
    SELECT 5 AS 'n'
    UNION ALL
    SELECT 8
    UNION ALL
    SELECT 5
    UNION ALL
    SELECT 30
    UNION ALL
    SELECT 31
    UNION ALL
    SELECT 32) a;

+----+--------------------------+--------------------------------+
| n  | RANK() OVER (ORDER BY n) | DENSE_RANK() OVER (ORDER BY n) |
+----+--------------------------+--------------------------------+
|  5 |                        1 |                              1 |
|  5 |                        1 |                              1 |
|  8 |                        3 |                              2 |
| 30 |                        4 |                              3 |
| 31 |                        5 |                              4 |
| 32 |                        6 |                              5 |
+----+--------------------------+--------------------------------+
6 rows in set (0.00 sec)

`ROW_NUMBER()`

ROW_NUMBER() 返回当前行在结果集中的行号。

WITH RECURSIVE cte(n) AS (
    SELECT
        1
    UNION
    SELECT
        n+3
    FROM
        cte
    WHERE
        n<30
)
SELECT
    n,
    ROW_NUMBER() OVER ()
FROM
    cte;

+------+----------------------+
| n    | ROW_NUMBER() OVER () |
+------+----------------------+
|    1 |                    1 |
|    4 |                    2 |
|    7 |                    3 |
|   10 |                    4 |
|   13 |                    5 |
|   16 |                    6 |
|   19 |                    7 |
|   22 |                    8 |
|   25 |                    9 |
|   28 |                   10 |
|   31 |                   11 |
+------+----------------------+
11 rows in set (0.00 sec)

窗口函数

CUME_DIST()

DENSE_RANK()

FIRST_VALUE()

LAG()

LAST_VALUE()

LEAD()

NTH_VALUE()

NTILE()

PERCENT_RANK()

RANK()

ROW_NUMBER()

文档内容是否有帮助？