最大/最小を排除

SQL文にmax min関数が含まれている場合、クエリオプティマイザはmax最適化ルールを適用して、 max / min集計関数をTopN演算子に変換しようとします。これにより、TiDBはインデックスを通じてクエリminより効率的に実行できます。

この最適化ルールはmin selectステートメント内のmax関数の数に応じて次の 2 つのタイプに分けられます。

max / min関数が1つだけあるステートメント
複数のmax / min関数を含むステートメント

1つの`max` / `min`関数

SQL ステートメントが次の条件を満たす場合、このルールが適用されます。

ステートメントには、 maxまたはmin集計関数が 1 つだけ含まれています。
集計関数には関連するgroup by節がありません。

例えば：

select max(a) from t

最適化ルールにより、ステートメントは次のように書き換えられます。

select max(a) from (select a from t where a is not null order by a desc limit 1) t

列aインデックスが設定されている場合、または列a複合インデックスのプレフィックスになっている場合、インデックスの助けを借りて、新しいSQL文は1行のデータのみをスキャンすることで最大値または最小値を見つけられます。この最適化により、フルテーブルスキャンが回避されます。

この例のステートメントには次の実行プランがあります。

mysql> explain select max(a) from t;
+------------------------------+---------+-----------+-------------------------+-------------------------------------+
| id                           | estRows | task      | access object           | operator info                       |
+------------------------------+---------+-----------+-------------------------+-------------------------------------+
| StreamAgg_13                 | 1.00    | root      |                         | funcs:max(test.t.a)->Column#4       |
| └─Limit_17                   | 1.00    | root      |                         | offset:0, count:1                   |
|   └─IndexReader_27           | 1.00    | root      |                         | index:Limit_26                      |
|     └─Limit_26               | 1.00    | cop[tikv] |                         | offset:0, count:1                   |
|       └─IndexFullScan_25     | 1.00    | cop[tikv] | table:t, index:idx_a(a) | keep order:true, desc, stats:pseudo |
+------------------------------+---------+-----------+-------------------------+-------------------------------------+
5 rows in set (0.00 sec)

複数の`max` / `min`関数

SQL ステートメントが次の条件を満たす場合、このルールが適用されます。

ステートメントには複数の集計関数が含まれており、それらはすべてmaxまたはmin関数です。
集計関数には関連するgroup by句がありません。
各max関数の列には順序を維持するためのインデックスminあります。

例えば：

select max(a) - min(a) from t

最適化ルールはまず、列a順序を維持するためのインデックスがあるかどうかを確認します。インデックスがある場合、SQL文は2つのサブクエリの直積として書き換えられます。

select max_a - min_a
from
    (select max(a) as max_a from t) t1,
    (select min(a) as min_a from t) t2

この書き換えにより、オプティマイザは2つのサブクエリにそれぞれmax関数をminつだけ含む文のルールを適用できます。その結果、文は次のように書き換えられます。

select max_a - min_a
from
    (select max(a) as max_a from (select a from t where a is not null order by a desc limit 1) t) t1,
    (select min(a) as min_a from (select a from t where a is not null order by a asc limit 1) t) t2

同様に、列a順序を保持するインデックスがある場合、最適化された実行ではテーブル全体ではなく、2行のデータのみがスキャンされます。しかし、列aに順序を保持するインデックスがない場合、このルールではフルテーブルスキャンが2回実行されますが、書き換えが行われない限り、フルテーブルスキャンは1回で済みます。したがって、このような場合にはこのルールは適用されません。

最終的な実行プランは次のようになります。

mysql> explain select max(a)-min(a) from t;
+------------------------------------+---------+-----------+-------------------------+-------------------------------------+
| id                                 | estRows | task      | access object           | operator info                       |
+------------------------------------+---------+-----------+-------------------------+-------------------------------------+
| Projection_17                      | 1.00    | root      |                         | minus(Column#4, Column#5)->Column#6 |
| └─HashJoin_18                      | 1.00    | root      |                         | CARTESIAN inner join                |
|   ├─StreamAgg_45(Build)            | 1.00    | root      |                         | funcs:min(test.t.a)->Column#5       |
|   │ └─Limit_49                     | 1.00    | root      |                         | offset:0, count:1                   |
|   │   └─IndexReader_59             | 1.00    | root      |                         | index:Limit_58                      |
|   │     └─Limit_58                 | 1.00    | cop[tikv] |                         | offset:0, count:1                   |
|   │       └─IndexFullScan_57       | 1.00    | cop[tikv] | table:t, index:idx_a(a) | keep order:true, stats:pseudo       |
|   └─StreamAgg_24(Probe)            | 1.00    | root      |                         | funcs:max(test.t.a)->Column#4       |
|     └─Limit_28                     | 1.00    | root      |                         | offset:0, count:1                   |
|       └─IndexReader_38             | 1.00    | root      |                         | index:Limit_37                      |
|         └─Limit_37                 | 1.00    | cop[tikv] |                         | offset:0, count:1                   |
|           └─IndexFullScan_36       | 1.00    | cop[tikv] | table:t, index:idx_a(a) | keep order:true, desc, stats:pseudo |
+------------------------------------+---------+-----------+-------------------------+-------------------------------------+
12 rows in set (0.01 sec)

最大/最小を排除

1つのmax / min関数

複数のmax / min関数

このページは役に立ちましたか？

1つの`max` / `min`関数

複数の`max` / `min`関数