📣

TiDB Cloud Essential はパブリックプレビュー中です。このページは自動翻訳されたものです。原文はこちらからご覧ください。

EXPLAIN分析

EXPLAIN ANALYZE文はEXPLAINと似た動作をしますが、大きな違いは実際に文を実行する点です。これにより、クエリプランニングに使用された推定値と、実行時に検出された実際の値を比較できます。推定値が実際の値と大きく異なる場合は、影響を受けるテーブルに対してANALYZE TABLE実行することを検討してください。

注記：
EXPLAIN ANALYZE使用してDML文を実行すると、データの変更が正常に実行されます。現時点では、DML文の実行プランはまだ表示できません。

概要

ExplainSym
ExplainStmt
ExplainableStmt

ExplainSym ::=
    'EXPLAIN'
|   'DESCRIBE'
|    'DESC'

ExplainStmt ::=
    ExplainSym ( TableName ColumnName? | 'ANALYZE'? ExplainableStmt | 'FOR' 'CONNECTION' NUM | 'FORMAT' '=' ( stringLit | ExplainFormatType ) ( 'FOR' 'CONNECTION' NUM | ExplainableStmt ) )

ExplainableStmt ::=
    SelectStmt
|   DeleteFromStmt
|   UpdateStmt
|   InsertIntoStmt
|   ReplaceIntoStmt
|   UnionStmt

EXPLAIN ANALYZE出力形式

EXPLAINとは異なり、 EXPLAIN ANALYZE対応するSQL文を実行し、その実行時情報を記録し、実行計画とともにその情報を返します。したがって、 EXPLAIN ANALYZE EXPLAINの拡張版と見なすことができます。 EXPLAIN (クエリ実行のデバッグ用) と比較すると、 EXPLAIN ANALYZEの戻り値にはactRows 、 execution info 、 memory 、 diskといった情報列も含まれます。これらの列の詳細は以下のとおりです。

属性名	説明
アクトロウズ	演算子によって出力される行数。
実行情報	演算子の実行情報。1 `time`演算子に入ってから演算子を出るまでの合計`wall time`表します。これには、すべてのサブ演算子の合計実行時間が含まれます。演算子が親演算子（ループ内）によって何度も呼び出される場合は、その累積時間を参照します。5 `loops` 、現在の演算子が親演算子によって呼び出された回数です。
メモリ	演算子によって占有されるメモリ領域。
ディスク	オペレータが占有するディスク領域。

例

CREATE TABLE t1 (id INT NOT NULL PRIMARY KEY AUTO_INCREMENT, c1 INT NOT NULL);

Query OK, 0 rows affected (0.12 sec)

INSERT INTO t1 (c1) VALUES (1), (2), (3);

Query OK, 3 rows affected (0.02 sec)
Records: 3  Duplicates: 0  Warnings: 0

EXPLAIN ANALYZE SELECT * FROM t1 WHERE id = 1;

+-------------+---------+---------+------+---------------+----------------------------------------------------------------+---------------+--------+------+
| id          | estRows | actRows | task | access object | execution info                                                 | operator info | memory | disk |
+-------------+---------+---------+------+---------------+----------------------------------------------------------------+---------------+--------+------+
| Point_Get_1 | 1.00    | 1       | root | table:t1      | time:757.205µs, loops:2, Get:{num_rpc:1, total_time:697.051µs} | handle:1      | N/A    | N/A  |
+-------------+---------+---------+------+---------------+----------------------------------------------------------------+---------------+--------+------+
1 row in set (0.01 sec)

EXPLAIN ANALYZE SELECT * FROM t1;

+-------------------+----------+---------+-----------+---------------+-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+--------------------------------+-----------+------+
| id                | estRows  | actRows | task      | access object | execution info                                                                                                                                                                                                                            | operator info                  | memory    | disk |
+-------------------+----------+---------+-----------+---------------+-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+--------------------------------+-----------+------+
| TableReader_5     | 10000.00 | 3       | root      |               | time:278.2µs, loops:2, cop_task: {num: 1, max: 437.6µs, proc_keys: 3, copr_cache_hit_ratio: 0.00}, rpc_info:{Cop:{num_rpc:1, total_time:423.9µs}}                                                                                         | data:TableFullScan_4           | 251 Bytes | N/A  |
| └─TableFullScan_4 | 10000.00 | 3       | cop[tikv] | table:t1      | tikv_task:{time:0s, loops:1}, scan_detail: {total_process_keys: 3, total_process_keys_size: 111, total_keys: 4, rocksdb: {delete_skipped_count: 0, key_skipped_count: 3, block: {cache_hit_count: 0, read_count: 0, read_byte: 0 Bytes}}} | keep order:false, stats:pseudo | N/A       | N/A  |
+-------------------+----------+---------+-----------+---------------+-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+--------------------------------+-----------+------+
2 rows in set (0.00 sec)

オペレータの実行情報

基本的なtimeとloop実行情報に加えて、 execution infoはオペレータ固有の実行情報も含まれます。これには主に、オペレータが RPC 要求を送信するのにかかった時間やその他のステップの実行時間が含まれます。

ポイントゲット

Point_Get演算子からの実行情報には通常、次の情報が含まれます。

Get:{num_rpc:1, total_time:697.051µs} ：TiKVに送信されたGet RPC要求の数（ num_rpc ）とすべてのRPC要求の合計期間（ total_time ）。
ResolveLock:{num_rpc:1, total_time:12.117495ms} ：TiDBはデータの読み取り時にロックに遭遇した場合、まずロックを解決する必要があります。これは通常、読み取り/書き込み競合のシナリオで発生します。この情報は、ロック解決にかかる時間を示します。
regionMiss_backoff:{num:11, total_time:2010 ms},tikvRPC_backoff:{num:11, total_time:10691 ms} : RPCリクエストが失敗した場合、TiDBはリクエストを再試行する前にバックオフ時間だけ待機します。バックオフ統計には、バックオフの種類（ regionMiss tikvRPC ）、合計待機時間（ total_time ）、バックオフの合計回数（ num ）が含まれます。

バッチポイント取得

Batch_Point_Getオペレータの実行情報はPoint_Getオペレータと似ていますが、 Batch_Point_Get通常、データを読み取りするためにBatchGet RPC 要求を TiKV に送信します。

BatchGet:{num_rpc:2, total_time:83.13µs} : TiKVに送信されたBatchGetタイプのRPC要求の数( num_rpc )とすべてのRPC要求に費やされた合計時間( total_time )。

テーブルリーダー

TableReader演算子の実行情報は、通常、次のようになります。

cop_task: {num: 6, max: 1.07587ms, min: 844.312µs, avg: 919.601µs, p95: 1.07587ms, max_proc_keys: 16, p95_proc_keys: 16, tot_proc: 1ms, tot_wait: 1ms, copr_cache_hit_ratio: 0.00}, rpc_info:{Cop:{num_rpc:6, total_time:5.313996ms}}

cop_task : copのタスクの実行情報が含まれます。例:
- num : cop タスクの数。
- max p95 cop タスクmin実行に費やされた実行時間の最大値、最小値、平均値、および P95 avg 。
- max_proc_keysとp95_proc_keys ：TiKVがすべてのcopタスクでスキャンしたキー値の最大値とP95値。最大値とP95値の差が大きい場合、データ分布が不均衡になる可能性があります。
- copr_cache_hit_ratio : copタスク要求に対するコプロセッサーキャッシュのヒット率。
rpc_info : 要求タイプ別に集計された、TiKV に送信された RPC 要求の合計数と合計時間。
backoff : さまざまなタイプのバックオフとバックオフの合計待機時間が含まれます。

入れる

Insert演算子の実行情報は、通常、次のようになります。

prepare:109.616µs, check_insert:{total_time:1.431678ms, mem_insert_time:667.878µs, prefetch:763.8µs, rpc:{BatchGet:{num_rpc:1, total_time:699.166µs},Get:{num_rpc:1, total_time:378.276µs }}}

prepare : 式、デフォルト値、自動増分値の計算など、書き込みの準備にかかる時間。
check_insert ：この情報は通常、 insert ignore文目とinsert on duplicate文目で表示されます。これには、競合チェックやTiDBトランザクションキャッシュへのデータ書き込みに要した時間などが含まれます。この時間消費には、トランザクションのコミットに要した時間は含まれないことに注意してください。この情報には以下の情報が含まれます。
- total_time : ステップcheck_insertに費やされた合計時間。
- mem_insert_time : TiDB トランザクションキャッシュにデータを書き込むのにかかる時間。
- prefetch : TiKVから競合チェックが必要なデータを取得する時間。このステップでは、データを取得するためにBatch_Get RPCリクエストをTiKVに送信します。
- rpc : TiKV への RPC 要求の送信に費やされた合計時間。これには通常、 BatchGetとGet 2 種類の RPC 時間が含まれます。
  - prefetch番目のステップでBatchGet RPC 要求が送信されます。
  - insert on duplicateステートメントが実行されると、 Get duplicate update RPC 要求が送信されます。
backoff : さまざまなタイプのバックオフとバックオフの合計待機時間が含まれます。

インデックス結合

IndexJoin演算子は、1つの外部ワーカーとN個の内部ワーカーを並列実行のために使用します。結合結果は外部テーブルの順序を保持します。詳細な実行プロセスは以下のとおりです。

外側のワーカーは N 個の外側の行を読み取り、それをタスクにラップして、結果チャネルと内側のワーカーチャネルに送信します。
内部ワーカーはタスクを受け取り、タスクからキー範囲を構築し、キー範囲に従って内部行を取得します。そして、内部行ハッシュテーブルを構築します。
メインIndexJoinスレッドは結果チャネルからタスクを受け取り、内部ワーカーがタスクの処理を完了するまで待機します。
メインIndexJoinスレッドは、内側の行のハッシュテーブルを参照して、各外側の行を結合します。

IndexJoin演算子には次の実行情報が含まれています。

inner:{total:4.297515932s, concurrency:5, task:17, construct:97.96291ms, fetch:4.164310088s, build:35.219574ms}, probe:53.574945ms

Inner : 内部ワーカーの実行情報:
- total : 内部ワーカーによって消費された合計時間。
- concurrency : 同時内部ワーカーの数。
- task : 内部ワーカーによって処理されたタスクの合計数。
- construct : 内部ワーカーがタスクに対応する内部テーブル行を読み取る前の準備時間。
- fetch : 内部ワーカーが内部テーブル行を読み取るのにかかる合計時間。
- Build : 内部ワーカーが対応する内部テーブル行のハッシュテーブルを構築するのにかかる合計時間。
probe : メインIndexJoinスレッドが外部テーブル行と内部テーブル行のハッシュテーブルとの結合操作を実行するのに費やした合計時間。

インデックスハッシュ結合

IndexHashJoin演算子の実行プロセスはIndexJoin演算子と同様です。5演算IndexHashJoinも1つの外部ワーカーとN個の内部ワーカーで並列実行されますが、出力順序は外部テーブルと一致するとは限りません。詳細な実行プロセスは以下のとおりです。

外側のワーカーは N 個の外側の行を読み取り、タスクを構築して、それを内側のワーカーチャネルに送信します。
内部ワーカーは内部ワーカーチャネルからタスクを受け取り、各タスクに対して以下の3つの操作を順番に実行します。a. 外部行からハッシュテーブルを構築する。b. 外部行からキー範囲を構築し、内部行を取得する。c. ハッシュテーブルをプローブし、結合結果を結果チャネルに送信する。注：ステップaとステップbは同時に実行されます。
IndexHashJoinのメインスレッドは、結果チャネルから結合結果を受信します。

IndexHashJoin演算子には次の実行情報が含まれています。

inner:{total:4.429220003s, concurrency:5, task:17, construct:96.207725ms, fetch:4.239324006s, build:24.567801ms, join:93.607362ms}

Inner : 内部ワーカーの実行情報:
- total : 内部ワーカーによって消費された合計時間。
- concurrency : 内部ワーカーの数。
- task : 内部ワーカーによって処理されたタスクの合計数。
- construct : 内部ワーカーが内部テーブルの行を読み取る前の準備時間。
- fetch : 内部ワーカーが内部テーブル行を読み取るのに費やされた合計時間。
- Build : 内部ワーカーが外部テーブル行のハッシュテーブルを構築するのに費やされた合計時間。
- join : 内部ワーカーが内部テーブル行と外部テーブル行のハッシュテーブルを結合するのにかかる合計時間。

ハッシュジョイン

HashJoin演算子は、内部ワーカー、外部ワーカー、および N 個の結合ワーカーで構成されます。詳細な実行プロセスは次のとおりです。

内部ワーカーは内部テーブルの行を読み取り、ハッシュテーブルを構築します。
外部ワーカーは外部テーブルの行を読み取り、それをタスクにラップして結合ワーカーに送信します。
結合ワーカーは、ステップ 1 のハッシュテーブルの構築が完了するまで待機します。
結合ワーカーは、タスク内の外部テーブルの行とハッシュテーブルを使用して結合操作を実行し、結合結果を結果チャネルに送信します。
HashJoinのメインスレッドは結果チャネルから結合結果を受信します。

HashJoin演算子には次の実行情報が含まれています。

build_hash_table:{total:146.071334ms, fetch:110.338509ms, build:35.732825ms}, probe:{concurrency:5, total:857.162518ms, max:171.48271ms, probe:125.341665ms, fetch:731.820853ms}

build_hash_table : 内部テーブルのデータを読み取り、ハッシュテーブルの実行情報を構築します。
- total : 合計消費時間。
- fetch : 内部テーブルデータの読み取りに費やされた合計時間。
- build : ハッシュテーブルの構築に費やされた合計時間。
probe : 結合ワーカーの実行情報:
- concurrency : 結合ワーカーの数。
- total : すべての結合ワーカーによって消費された合計時間。
- max : 単一の結合ワーカーが実行される最長時間。
- probe : 外部テーブルの行とハッシュテーブルとの結合に費やされた合計時間。
- fetch : 結合ワーカーが外部テーブルの行データを読み取るために待機する合計時間。

テーブルフルスキャン (TiFlash)

TiFlashノードで実行されるTableFullScan演算子には、次の実行情報が含まれます。

tiflash_scan: {
  dtfile: {
    total_scanned_packs: 2, 
    total_skipped_packs: 1, 
    total_scanned_rows: 16000, 
    total_skipped_rows: 8192, 
    total_rough_set_index_load_time: 2ms, 
    total_read_time: 20ms
  }, 
  total_create_snapshot_time: 1ms
}

dtfile : テーブルスキャン中の DTFile (DeltaTree ファイル) 関連情報。TiFlash TiFlashレイヤーのデータスキャンステータスを反映します。
- total_scanned_packs : DTFileでスキャンされたパックの総数。パックとは、 TiFlash DTFileで読み取ることができる最小単位です。デフォルトでは、8192行ごとに1パックが構成されます。
- total_skipped_packs : DTFile 内のスキャンでスキップされたパックの総数。2 WHEREが粗集合インデックスにヒットするか、主キーの範囲フィルタリングに一致する場合、無関係なパックはスキップされます。
- total_scanned_rows : DTFile でスキャンされた行の総数。MVCC により更新または削除のバージョンが複数ある場合、各バージョンは個別にカウントされます。
- total_skipped_rows : DTFile 内のスキャンによってスキップされる行の合計数。
- total_rs_index_load_time : DTFile のラフセットインデックスの読み取りに費やされた合計時間。
- total_read_time : DTFile データの読み取りに費やされた合計時間。
total_create_snapshot_time : テーブルスキャン中にスナップショットを作成するために使用された合計時間。

lock_keys実行情報

悲観的トランザクションでDML文が実行されると、演算子の実行情報にlock_keysの実行情報も含まれる場合があります。例:

lock_keys: {time:94.096168ms, region:6, keys:8, lock_rpc:274.503214ms, rpc_count:6}

time : lock_keys操作を実行する合計時間。
region : lock_keys操作の実行に関係する領域の数。
keys : Lock必要なKeyの数。
lock_rpc ：タイプLockのRPCリクエストをTiKVに送信するのに費やされた合計時間。複数のRPCリクエストが並行して送信される可能性があるため、RPCの合計消費時間はタイプlock_keys操作の合計消費時間よりも長くなる可能性があります。
rpc_count : TiKV に送信されたLockタイプの RPC 要求の合計数。

commit_txn実行情報

autocommit=1のトランザクションで書き込み型DML文が実行されると、書き込み演算子の実行情報にはトランザクションコミットの実行時間情報も含まれます。例:

commit_txn: {prewrite:48.564544ms, wait_prewrite_binlog:47.821579, get_commit_ts:4.277455ms, commit:50.431774ms, region_num:7, write_keys:16, write_byte:536}

prewrite : トランザクションの 2PC コミットのprewrite番目のフェーズに費やされた時間。
wait_prewrite_binlog: : 事前書き込みBinlog の書き込みを待機するのにかかる時間。
get_commit_ts : トランザクションコミットタイムスタンプを取得するのに費やされた時間。
commit : トランザクションの 2PC コミット中にcommitフェーズで消費された時間。
write_keys : トランザクションに書き込まれた合計keys 。
write_byte : トランザクションで書き込まれた合計バイト数key-value単位はバイトです。

RU（リクエストユニット）消費量

リクエストユニット（RU）、TiDB リソース制御で定義されているシステムリソースの統一された抽象単位です。最上位演算子のexecution infoこの特定の SQL 文の全体的な RU 消費量を示します。

RU:273.842670

注記：
この値は、今回の実行で実際に消費されたRU数を示します。キャッシュの影響により、同じSQL文でも実行ごとに消費されるRU数が異なる場合があります（例：コプロセッサキャッシュ）。

RUは、 EXPLAIN ANALYZE 、特にexecution info列目の他の値から計算できます。例えば、次のようになります。

'executeInfo':
   time:2.55ms, 
   loops:2, 
   RU:0.329460, 
   Get:{
       num_rpc:1,
       total_time:2.13ms
   }, 
   total_process_time: 231.5µs,
   total_wait_time: 732.9µs, 
   tikv_wall_time: 995.8µs,
   scan_detail: {
      total_process_keys: 1, 
      total_process_keys_size: 150, 
      total_keys: 1, 
      get_snapshot_time: 691.7µs,
      rocksdb: {
          block: {
              cache_hit_count: 2,
              read_count: 1,
              read_byte: 8.19 KB,
              read_time: 10.3µs
          }
      }
  },

基本コストはtikv/pdソースコードファイルで定義され、計算はmodel.goファイルで実行されます。

TiDB v7.1 を使用している場合、計算はpd/pd-client/model.goのBeforeKVRequest()とAfterKVRequest()合計になります。つまり、次のようになります。

before key/value request is processed:
      consumption.RRU += float64(kc.ReadBaseCost) -> kv.ReadBaseCost * rpc_nums

after key/value request is processed:
      consumption.RRU += float64(kc.ReadBytesCost) * readBytes -> kc.ReadBytesCost * total_process_keys_size
      consumption.RRU += float64(kc.CPUMsCost) * kvCPUMs -> kc.CPUMsCost * total_process_time

書き込みとバッチ取得の場合、計算は基本コストが異なりますが、同様です。

その他の一般的な実行情報

コプロセッサーオペレータには通常、実行時間情報の2つの部分、 cop_taskとtikv_task含まれます。5 cop_task TiDBによって記録された時間で、リクエストがサーバーに送信されてからレスポンスが受信されるまでの時間です。7 tikv_task TiKVコプロセッサー自体によって記録された時間です。この2つの値に大きな差がある場合は、レスポンスの待機時間が長すぎるか、gRPCまたはネットワークで費やされた時間が長すぎることを示している可能性があります。

MySQLの互換性

EXPLAIN ANALYZEは MySQL 8.0 の機能ですが、TiDB の出力形式と潜在的な実行プランはどちらも MySQL とは大幅に異なります。