最大値/最小値の削除

SQL ステートメントにmax / min関数が含まれている場合、クエリ オプティマイザーはmax / min最適化ルールを適用して、 max / min集計関数をTopN 演算子に変換しようとします。このように、TiDB はインデックスを使用してクエリをより効率的に実行できます。

この最適化ルールは、 selectステートメント内のmax / min関数の数に応じて、次の 2 種類に分けられます。

1つのmax / min関数

SQL ステートメントが次の条件を満たす場合、このルールが適用されます。

  • ステートメントには、集約関数が 1 つだけ ( maxまたはmin含まれています。
  • 集計関数には関連するgroup by句がありません。

例えば:

select max(a) from t

最適化ルールはステートメントを次のように書き換えます。

select max(a) from (select a from t where a is not null order by a desc limit 1) t

aにインデックスがある場合、または列aが複合インデックスのプレフィックスである場合、インデックスの助けを借りて、新しい SQL ステートメントは 1 行のデータのみをスキャンすることで最大値または最小値を見つけることができます。この最適化により、テーブル全体のスキャンが回避されます。

ステートメントの例には次の実行プランがあります。

mysql> explain select max(a) from t; +------------------------------+---------+-----------+-------------------------+-------------------------------------+ | id | estRows | task | access object | operator info | +------------------------------+---------+-----------+-------------------------+-------------------------------------+ | StreamAgg_13 | 1.00 | root | | funcs:max(test.t.a)->Column#4 | | └─Limit_17 | 1.00 | root | | offset:0, count:1 | | └─IndexReader_27 | 1.00 | root | | index:Limit_26 | | └─Limit_26 | 1.00 | cop[tikv] | | offset:0, count:1 | | └─IndexFullScan_25 | 1.00 | cop[tikv] | table:t, index:idx_a(a) | keep order:true, desc, stats:pseudo | +------------------------------+---------+-----------+-------------------------+-------------------------------------+ 5 rows in set (0.00 sec)

複数のmax / min関数

SQL ステートメントが次の条件を満たす場合、このルールが適用されます。

  • ステートメントには複数の集計関数が含まれており、それらはすべてmaxまたはminの関数です。
  • どの集約関数にも関連するgroup by句はありません。
  • max / min関数の列には、順序を維持するためのインデックスがあります。

例えば:

select max(a) - min(a) from t

最適化ルールはまず、列aに順序を維持するためのインデックスがあるかどうかを確認します。 「はい」の場合、SQL ステートメントは 2 つのサブクエリのデカルト積として書き換えられます。

select max_a - min_a from (select max(a) as max_a from t) t1, (select min(a) as min_a from t) t2

書き換えにより、オプティマイザはmax / min関数を 1 つだけ含むステートメントのルールを 2 つのサブクエリにそれぞれ適用できます。このステートメントは次のように書き換えられます。

select max_a - min_a from (select max(a) as max_a from (select a from t where a is not null order by a desc limit 1) t) t1, (select min(a) as min_a from (select a from t where a is not null order by a asc limit 1) t) t2

同様に、列aに順序を保存するインデックスがある場合、最適化された実行ではテーブル全体ではなく 2 行のデータのみがスキャンされます。ただし、列aに順序を保持するインデックスがない場合、このルールにより 2 回のテーブル全体のスキャンが行われますが、書き換えられない場合、実行に必要なテーブル全体のスキャンは 1 回だけです。したがって、このような場合には、このルールは適用されません。

最終的な実行計画は次のとおりです。

mysql> explain select max(a)-min(a) from t; +------------------------------------+---------+-----------+-------------------------+-------------------------------------+ | id | estRows | task | access object | operator info | +------------------------------------+---------+-----------+-------------------------+-------------------------------------+ | Projection_17 | 1.00 | root | | minus(Column#4, Column#5)->Column#6 | | └─HashJoin_18 | 1.00 | root | | CARTESIAN inner join | | ├─StreamAgg_45(Build) | 1.00 | root | | funcs:min(test.t.a)->Column#5 | | │ └─Limit_49 | 1.00 | root | | offset:0, count:1 | | │ └─IndexReader_59 | 1.00 | root | | index:Limit_58 | | │ └─Limit_58 | 1.00 | cop[tikv] | | offset:0, count:1 | | │ └─IndexFullScan_57 | 1.00 | cop[tikv] | table:t, index:idx_a(a) | keep order:true, stats:pseudo | | └─StreamAgg_24(Probe) | 1.00 | root | | funcs:max(test.t.a)->Column#4 | | └─Limit_28 | 1.00 | root | | offset:0, count:1 | | └─IndexReader_38 | 1.00 | root | | index:Limit_37 | | └─Limit_37 | 1.00 | cop[tikv] | | offset:0, count:1 | | └─IndexFullScan_36 | 1.00 | cop[tikv] | table:t, index:idx_a(a) | keep order:true, desc, stats:pseudo | +------------------------------------+---------+-----------+-------------------------+-------------------------------------+ 12 rows in set (0.01 sec)

このページは役に立ちましたか?