分析
このステートメントは、TiDBがテーブルとインデックスに対して構築する統計情報を更新します。大規模なバッチ更新またはレコードのインポートを実行した後、またはクエリ実行プランが最適ではないことに気付いた場合は、 ANALYZE実行することをお勧めします。
TiDB は、統計が自身の推定値と一致していないことが判明すると、時間の経過とともに統計を自動的に更新します。
現在、TiDBはANALYZE TABLE文を使用して完全なコレクションとして統計情報を収集します。詳細については、 統計学入門参照してください。
概要
- AnalyzeTableStmt
- AnalyzeOptionListOpt
- AnalyzeOptionList
- AnalyzeOption
- AnalyzeColumnOption
- TableNameList
- TableName
- ColumnNameList
- IndexNameList
- PartitionNameList
AnalyzeTableStmt ::=
    'ANALYZE' ( 'TABLE' ( TableNameList ( 'ALL COLUMNS' | 'PREDICATE COLUMNS' ) | TableName ( 'INDEX' IndexNameList? | AnalyzeColumnOption | 'PARTITION' PartitionNameList ( 'INDEX' IndexNameList? | AnalyzeColumnOption )? )? ) ) AnalyzeOptionListOpt
AnalyzeOptionListOpt ::=
( WITH AnalyzeOptionList )?
AnalyzeOptionList ::=
AnalyzeOption ( ',' AnalyzeOption )*
AnalyzeOption ::=
( NUM ( 'BUCKETS' | 'TOPN' | ( 'CMSKETCH' ( 'DEPTH' | 'WIDTH' ) ) | 'SAMPLES' ) ) | ( FLOATNUM 'SAMPLERATE' )
AnalyzeColumnOption ::=
( 'ALL COLUMNS' | 'PREDICATE COLUMNS' | 'COLUMNS' ColumnNameList )
TableNameList ::=
    TableName (',' TableName)*
TableName ::=
    Identifier ( '.' Identifier )?
ColumnNameList ::=
    Identifier ( ',' Identifier )*
IndexNameList ::=
    Identifier ( ',' Identifier )*
PartitionNameList ::=
    Identifier ( ',' Identifier )*
例
mysql> CREATE TABLE t1 (id INT NOT NULL PRIMARY KEY AUTO_INCREMENT, c1 INT NOT NULL);
Query OK, 0 rows affected (0.11 sec)
mysql> INSERT INTO t1 (c1) VALUES (1),(2),(3),(4),(5);
Query OK, 5 rows affected (0.03 sec)
Records: 5  Duplicates: 0  Warnings: 0
mysql> ALTER TABLE t1 ADD INDEX (c1);
Query OK, 0 rows affected (0.30 sec)
mysql> EXPLAIN SELECT * FROM t1 WHERE c1 = 3;
+------------------------+---------+-----------+------------------------+---------------------------------------------+
| id                     | estRows | task      | access object          | operator info                               |
+------------------------+---------+-----------+------------------------+---------------------------------------------+
| IndexReader_6          | 10.00   | root      |                        | index:IndexRangeScan_5                      |
| └─IndexRangeScan_5     | 10.00   | cop[tikv] | table:t1, index:c1(c1) | range:[3,3], keep order:false, stats:pseudo |
+------------------------+---------+-----------+------------------------+---------------------------------------------+
2 rows in set (0.00 sec)
現在の統計のステータスはpseudoです。これは、統計が不正確であることを意味します。
mysql> ANALYZE TABLE t1;
Query OK, 0 rows affected (0.13 sec)
mysql> EXPLAIN SELECT * FROM t1 WHERE c1 = 3;
+------------------------+---------+-----------+------------------------+-------------------------------+
| id                     | estRows | task      | access object          | operator info                 |
+------------------------+---------+-----------+------------------------+-------------------------------+
| IndexReader_6          | 1.00    | root      |                        | index:IndexRangeScan_5        |
| └─IndexRangeScan_5     | 1.00    | cop[tikv] | table:t1, index:c1(c1) | range:[3,3], keep order:false |
+------------------------+---------+-----------+------------------------+-------------------------------+
2 rows in set (0.00 sec)
統計が正しく更新され、読み込まれるようになりました。
MySQLの互換性
TiDBは、収集する統計情報と、クエリ実行時に統計情報を利用する方法の両方においてMySQLとは異なります。この文は構文的にはMySQLに似ていますが、以下の違いがあります。
- TiDBは、 ANALYZE TABLE実行時に、ごく最近コミットされた変更を反映させない可能性があります。行のバッチ更新後、統計情報の更新にこれらの変更を反映させるには、ANALYZE TABLE実行する前にsleep(1)実行する必要がある場合があります#16570参照してください。
- ANALYZE TABLE、MySQL よりも TiDB で実行するのに大幅に時間がかかります。