Configure TiDB for Optimal Performance

重要

このページは英語版のページを機械翻訳しています。原文はこちらからご覧ください。

最適なパフォーマンスを得るための TiDB の設定

このガイドでは、TiDB のパフォーマンスを最適化する方法について説明します。

一般的なワークロードのベストプラクティス。
困難なパフォーマンスシナリオを処理するための戦略。

注記：
このガイドの最適化手法は、TiDB で最適なパフォーマンスを実現するのに役立ちます。ただし、パフォーマンスのチューニングには複数の要素のバランスを取る必要があることが多く、単一のソリューションですべてのパフォーマンスニーズに対応できるわけではありません。このガイドの一部の手法では、実験的機能を使用しており、その旨が示されています。これらの最適化によりパフォーマンスが大幅に向上する可能性がありますが、本番環境には適さない可能性があり、実装前に慎重に評価する必要があります。

概要

TiDB を最高のパフォーマンスに最適化するには、さまざまな設定を慎重に調整する必要があります。多くの場合、最適なパフォーマンスを実現するには、デフォルト値を超えて構成を調整する必要があります。

デフォルト設定では、パフォーマンスよりも安定性が優先されます。パフォーマンスを最大化するには、より積極的な構成や、場合によっては実験的機能を使用する必要がある場合があります。これらの推奨事項は、本番の展開経験とパフォーマンス最適化の調査に基づいています。

このガイドでは、デフォルト以外の設定について、その利点や潜在的なトレードオフなどを含めて説明します。この情報を使用して、ワークロード要件に合わせて TiDB 設定を最適化してください。

一般的なワークロードのキー設定

TiDB のパフォーマンスを最適化するために、次の設定が一般的に使用されます。

SQL 準備実行プランキャッシュや準備されていないプランキャッシュなどの実行プランキャッシュを強化します。
オプティマイザー修正コントロール使用して TiDB オプティマイザーの動作を最適化します。
タイタンstorageエンジンをより積極的に使用します。

これらの設定により、多くのワークロードのパフォーマンスが大幅に向上します。ただし、他の最適化と同様に、本番に展開する前に、ご使用の環境で徹底的にテストしてください。

システム変数

推奨設定を適用するには、次の SQL コマンドを実行します。

SET GLOBAL tidb_session_plan_cache_size=200; 
SET GLOBAL tidb_enable_non_prepared_plan_cache=on;
SET GLOBAL tidb_ignore_prepared_cache_close_stmt=on;
SET GLOBAL tidb_stats_load_sync_wait=2000;
SET GLOBAL tidb_enable_inl_join_inner_multi_pattern=on;
SET GLOBAL tidb_opt_derive_topn=on;
SET GLOBAL tidb_runtime_filter_mode=LOCAL;
SET GLOBAL tidb_opt_enable_mpp_shared_cte_execution=on;
SET GLOBAL tidb_rc_read_check_ts=on;
SET GLOBAL tidb_guarantee_linearizability=off;
SET GLOBAL pd_enable_follower_handle_region=on;
SET GLOBAL tidb_opt_fix_control = '44262:ON,44389:ON,44823:10000,44830:ON,44855:ON,52869:ON';

次の表は、特定のシステム変数の構成の影響を示しています。

システム変数	説明	注記
`tidb_session_plan_cache_size`	キャッシュできるプランの最大数をデフォルトの`100`から`200`に増やします。これにより、プリペアドステートメントパターンが多数あるワークロードのパフォーマンスが向上します。	この値を増やすと、セッションプランキャッシュのメモリ使用量が増加する可能性があります。
`tidb_enable_non_prepared_plan_cache`	準備されていないプランキャッシュ機能を有効にすると、準備されたステートメントを使用しないアプリケーションのコンパイルコストが削減されます。	該当なし
`tidb_ignore_prepared_cache_close_stmt`	準備されたステートメントを使用するが、実行ごとにプランを閉じるアプリケーションのプランをキャッシュします。	該当なし
`tidb_stats_load_sync_wait`	統計を同期的にロードするためのタイムアウトを、デフォルトの 100 ミリ秒から 2 秒に増やします。これにより、クエリのコンパイル前に TiDB が必要な統計をロードするようになります。	この値を大きくすると、クエリのコンパイル前の同期待機時間が長くなります。
`tidb_enable_inl_join_inner_multi_pattern`	内部テーブルに`Selection`または`Projection`演算子がある場合に、インデックス結合のサポートを有効にします。	該当なし
`tidb_opt_derive_topn`	ウィンドウ関数から TopN または Limit を導出するの最適化ルールを有効にします。	これは`ROW_NUMBER()`ウィンドウ関数に制限されます。
`tidb_runtime_filter_mode`	ハッシュ結合の効率を向上させるには、ローカルモードでランタイムフィルター有効にします。	この変数は v7.2.0 で導入され、安全のためデフォルトでは無効になっています。
`tidb_opt_enable_mpp_shared_cte_execution`	TiFlashへの非再帰的な共通テーブル式 (CTE)プッシュダウンを有効にします。	これは実験的機能です。
`tidb_rc_read_check_ts`	読み取りコミット分離レベルの場合、この変数を有効にすると、グローバルタイムスタンプの取得にかかるレイテンシーとコストが回避され、トランザクションレベルの読み取りレイテンシーが最適化されます。	この機能は、繰り返し読み取り分離レベルと互換性がありません。
`tidb_guarantee_linearizability`	PDサーバーからのコミットタイムスタンプの取得をスキップすることでパフォーマンスが向上します。	これにより、パフォーマンスを優先して線形化可能性が犠牲になります。因果一貫性のみが保証されます。厳密な線形化可能性を必要とするシナリオには適していません。
`pd_enable_follower_handle_region`	PDFollower機能を有効にして、PD フォロワーがリージョン要求を処理できるようにします。これにより、すべての PD サーバーに負荷が均等に分散され、PD リーダーの CPU 負荷が軽減されます。	これは実験的機能です。非本番環境でテストしてください。
`tidb_opt_fix_control`	高度なクエリ最適化戦略を有効にして、追加の最適化ルールとヒューリスティックを通じてパフォーマンスを向上させます。	パフォーマンスの向上はワークロードによって異なるため、ご使用の環境で徹底的にテストしてください。

追加の最適化を可能にするオプティマイザー制御構成について次に説明します。

44262:ON : グローバル統計つが不足している場合は、動的プルーニングモード使用してパーティションテーブルにアクセスします。
44389:ON : c = 10 and (a = 'xx' or (a = 'kk' and b = 1))などのフィルターの場合は、 IndexRangeScanのより包括的なスキャン範囲を構築します。
44823:10000 :メモリを節約するために、プランキャッシュはこの変数で指定された数を超えるパラメータを持つクエリをキャッシュしません。プランキャッシュパラメータの制限を200から10000に増やして、長いインリストを持つクエリでプランキャッシュを使用できるようにします。
44830:ON : プランキャッシュは、物理的な最適化中に生成されたPointGetの演算子を使用して実行プランをキャッシュできます。
44855:ON : IndexJoin演算子のProbe側にSelection演算子が含まれている場合、オプティマイザーはIndexJoin選択します。
52869:ON : オプティマイザがクエリプランに対して単一インデックススキャンメソッド (フルテーブルスキャン以外) を選択できる場合、オプティマイザはインデックスマージを自動的に選択します。

TiKV 構成

TiKV 構成ファイルに次の構成項目を追加します。

[server]
concurrent-send-snap-limit = 64
concurrent-recv-snap-limit = 64
snap-io-max-bytes-per-sec = "400MiB"

[rocksdb.titan]
enabled = true
[rocksdb.defaultcf.titan]
min-blob-size = "1KB"
blob-file-compression = "zstd"

[storage.flow-control]
l0-files-threshold = 60

コンフィグレーション項目	説明	注記
`concurrent-send-snap-limit` `concurrent-recv-snap-limit` `snap-io-max-bytes-per-sec`	TiKV スケーリング操作中に同時スナップショット転送と I/O 帯域幅の制限を設定します。制限を高くすると、データ移行が高速化され、スケーリング時間が短縮されます。	これらの制限を調整すると、スケーリング速度とオンライントランザクションのパフォーマンスのトレードオフに影響します。
`rocksdb.titan` `rocksdb.defaultcf.titan` `min-blob-size` `blob-file-compression`	Titanstorageエンジンを有効にして、書き込み増幅を減らし、ディスク I/O ボトルネックを軽減します。RocksDB の圧縮が書き込みワークロードに対応できず、保留中の圧縮バイトが蓄積される場合に特に便利です。	書き込み増幅が主なボトルネックになっている場合は、これを有効にします。トレードオフには次のものが含まれます。1. 主キー範囲スキャンに対する潜在的なパフォーマンスへの影響。2. スペース増幅の増加 (最悪の場合、最大 2 倍)。3. BLOB キャッシュの追加メモリ使用量。
`storage.flow-control.l0-files-threshold`	kvDB L0 ファイルの数に基づいて、書き込みフロー制御がトリガーされるタイミングを制御します。しきい値を増やすと、書き込みワークロードが高いときに書き込みが停止する回数が減少します。	しきい値を高くすると、多くの L0 ファイルが存在する場合に、より積極的な圧縮が行われる可能性があります。

TiFlash構成

TiFlash構成ファイルに次の構成項目を追加します。

[raftstore-proxy.server]
snap-io-max-bytes-per-sec = "300MiB"

コンフィグレーション項目	説明	注記
`snap-io-max-bytes-per-sec`	TiKV からTiFlashへのデータ複製の最大許容ディスク帯域幅を制御します。制限を高くすると、初期データの読み込みとキャッチアップ複製が高速化されます。	帯域幅の消費量が多いと、オンライントランザクションのパフォーマンスに影響する可能性があります。レプリケーション速度とシステムの安定性のバランスをとってください。

ベンチマーク

このセクションでは、デフォルト設定 (ベースライン) と、前述の一般的な負荷のキー設定に基づいて最適化された設定のパフォーマンスを比較します。

大きなレコード値に対するYCSBのワークロード

テスト環境

テスト環境は次のとおりです。

3 台の TiDB サーバー (16 コア、64 GiB)
3 台の TiKV サーバー (16 コア、64 GiB)
TiDB バージョン: v8.1.0
作業量: go-ycsb ワークロード

パフォーマンス比較

次の表は、ベースライン設定と最適化設定間のスループット (1 秒あたりの操作数) を比較したものです。

アイテム	ベースライン（OPS）	最適化（OPS）	改善
データを読み込む	2858.5	5074.3	+77.59%
作業負荷	2243.0	12804.3	+470.86%

パフォーマンス分析

Titan は v7.6.0 以降ではデフォルトで有効になっており、TiDB v8.1.0 の Titan のデフォルトmin-blob-sizeは32KiBです。ベースライン構成では、データが RocksDB に保存されるようにレコードサイズ31KiBを使用します。一方、キー設定構成では、 min-blob-sizeを1KiBに設定して、データが Titan に保存されるようにします。

主要な設定で確認されたパフォーマンスの向上は、主に Titan の RocksDB 圧縮を削減する機能によるものです。次の図に示されています。

ベースライン: RocksDB 圧縮の合計スループットは 1 GiB/秒を超え、ピーク時には 3 GiB/秒を超えます。
主要な設定: RocksDB 圧縮のピークスループットは 100 MiB/s 未満に維持されます。

この圧縮オーバーヘッドの大幅な削減は、主要な設定構成で確認される全体的なスループットの向上に貢献します。

Titan RocksDB compaction:

テストの作業負荷

次のgo-ycsb loadのコマンドはデータをロードします。

go-ycsb load mysql -P /ycsb/workloads/workloada -p {host} -p mysql.port={port} -p threadcount=100 -p recordcount=5000000 -p operationcount=5000000 -p workload=core -p requestdistribution=uniform -pfieldcount=31 -p fieldlength=1024

次のgo-ycsb runのコマンドはワークロードを実行します。

go-ycsb run mysql -P /ycsb/workloads/workloada -p {host} -p mysql.port={port} -p mysql.db=test -p threadcount=100 -p recordcount=5000000 -p operationcount=5000000 -p workload=core -prequestdistribution=uniform -p fieldcount=31 -p fieldlength=1024

エッジケースと最適化

このセクションでは、基本的な最適化を超えたターゲット調整が必要な特定のシナリオに合わせて TiDB を最適化する方法を説明します。特定のユースケースに合わせて TiDB を調整する方法を学習します。

エッジケースを特定する

エッジケースを識別するには、次の手順を実行します。

クエリパターンとワークロードの特性を分析します。
システムメトリックを監視してパフォーマンスのボトルネックを特定します。
特定の問題についてアプリケーションチームからフィードバックを収集します。

よくあるエッジケース

以下に、一般的なエッジケースをいくつか示します。

頻度の高い小さなクエリに対する TSO 待機時間が長い
さまざまなワークロードに適した最大チャンクサイズを選択する
読み取り負荷の高いワークロード向けにコプロセッサキャッシュを調整する
ワークロード特性に合わせてチャンクサイズを最適化する
さまざまなワークロードに合わせてトランザクションモードと DML タイプを最適化する
TiKVプッシュダウンでGROUP BYとDISTINCT操作を最適化する
バッチ操作中の統計収集を最適化する
さまざまなインスタンスタイプに合わせてスレッドプール設定を最適化する

次のセクションでは、それぞれのケースの処理方法について説明します。シナリオごとに異なるパラメータを調整するか、特定の TiDB 機能を使用する必要があります。

注記：
これらの最適化は、ユースケースやデータパターンによって効果が異なる可能性があるため、慎重に適用し、徹底的にテストしてください。

頻度の高い小さなクエリに対する TSO 待機時間が長い

トラブルシューティング

ワークロードに、タイムスタンプを頻繁に要求する小規模なトランザクションやクエリが頻繁に含まれる場合、TSO (Timestamp Oracle) がパフォーマンスのボトルネックになる可能性があります。TSO 待機時間がシステムに影響を与えているかどうかを確認するには、 パフォーマンスの概要 > SQL 実行時間の概要パネルを確認します。TSO 待機時間が SQL 実行時間の大部分を占める場合は、次の最適化を検討してください。

厳密な一貫性を必要としない読み取り操作には、低精度 TSO (有効tidb_low_resolution_tso ) を使用します。詳細については、解決策1: 低精度TSOを使用する参照してください。
tidb_enable_batch_dml有効にすると、バッチ操作の TSO 要求が削減されます。

解決策1: 低精度TSO

低精度TSO機能（ tidb_low_resolution_tso ）を有効にすると、TSO待機時間を短縮できます。この機能を有効にすると、TiDBはキャッシュされたタイムスタンプを使用してデータを読み取るため、潜在的に古い読み取りを犠牲にしてTSO待機時間を短縮できます。

この最適化は、次のシナリオで特に効果的です。

多少の古さが許容される、読み取り中心のワークロード。
絶対的な一貫性よりもクエリのレイテンシーを減らすことの方が重要なシナリオ。
最新のコミット状態から数秒遅れた読み取りを許容できるアプリケーション。

利点とトレードオフ:

キャッシュされた TSO を使用して古い読み取りを有効にすることでクエリのレイテンシーを短縮し、新しいタイムスタンプを要求する必要性を排除します。
パフォーマンスとデータの一貫性のバランスをとる: この機能は、古い読み取りが許容されるシナリオにのみ適しています。厳密なデータの一貫性が必要な場合には、この機能を使用することはお勧めしません。

この最適化を有効にするには:

SET GLOBAL tidb_low_resolution_tso=ON;

読み取り負荷の高いワークロード向けにコプロセッサキャッシュを調整する

コプロセッサキャッシュ最適化することで、読み取り負荷の高いワークロードのクエリパフォーマンスを向上させることができます。このキャッシュにはコプロセッサ要求の結果が格納され、頻繁にアクセスされるデータの繰り返し計算が削減されます。キャッシュパフォーマンスを最適化するには、次の手順を実行します。

コプロセッサーキャッシュで説明したメトリックを使用してキャッシュヒット率を監視します。
キャッシュサイズを増やすと、より大きなワーキングセットのヒット率が向上します。
クエリパターンに基づいて許可しきい値を調整します。

読み取り負荷の高いワークロードに推奨される設定を以下に示します。

[tikv-client.copr-cache]
capacity-mb = 4096
admission-max-ranges = 5000
admission-max-result-mb = 10
admission-min-process-ms = 0

ワークロード特性に合わせてチャンクサイズを最適化する

tidb_max_chunk_sizeシステム変数は、実行プロセス中のチャンク内の最大行数を設定します。ワークロードに基づいてこの値を調整すると、パフォーマンスが向上します。

大規模な同時実行性と小規模なトランザクションを伴う OLTP ワークロードの場合:
- 128行から256行の間の値を設定します (デフォルト値は1024です)。
- これにより、メモリ使用量が削減され、制限クエリが高速化されます。
- 使用例: ポイントクエリ、小範囲スキャン。
```
SET GLOBAL tidb_max_chunk_size = 128;
```
複雑なクエリと大規模な結果セットを含む OLAP または分析ワークロードの場合:
- 1024から4096行の間で値を設定します。
- これにより、大量のデータをスキャンする際のスループットが向上します。
- 使用例: 集計、大規模テーブルスキャン。
```
SET GLOBAL tidb_max_chunk_size = 4096;
```

さまざまなワークロードに合わせてトランザクションモードと DML タイプを最適化する

TiDB は、さまざまなワークロードパターンのパフォーマンスを最適化するために、さまざまなトランザクションモードと DML 実行タイプを提供します。

トランザクションモード

tidb_txn_modeシステム変数を使用してトランザクションモードを設定できます。

悲観的なトランザクションモード (デフォルト):
- 書き込み競合が発生する可能性のある一般的なワークロードに適しています。
- より強力な一貫性保証を提供します。
```
SET SESSION tidb_txn_mode = "pessimistic";
```
楽観的トランザクションモード :
- 書き込み競合が最小限のワークロードに適しています。
- 複数ステートメントのトランザクションのパフォーマンスが向上します。
- 例: BEGIN; INSERT...; INSERT...; COMMIT; .
```
SET SESSION tidb_txn_mode = "optimistic";
```

DMLタイプ

バージョン 8.0.0 で導入されたtidb_dml_typeシステム変数を使用して、DML ステートメントの実行モードを制御できます。

バルク DML 実行モードを使用するには、 tidb_dml_typeを"bulk"に設定します。このモードでは、競合なしでバルクデータのロードが最適化され、大規模な書き込み操作中のメモリ使用量が削減されます。このモードを使用する前に、次の点を確認してください。

自動コミットが有効になっています。
pessimistic-auto-commit構成項目はfalseに設定されています。

SET SESSION tidb_dml_type = "bulk";

TiKV プッシュダウンを使用して`GROUP BY`および`DISTINCT`操作を最適化する

TiDB は集計操作を TiKV にプッシュダウンして、データ転送と処理のオーバーヘッドを削減します。パフォーマンスの向上は、データの特性によって異なります。

使用シナリオ

理想的なシナリオ（高いパフォーマンス向上）:
- 異なる値がほとんど含まれない列 (NDV が低い)。
- 頻繁に重複する値を含むデータ。
- 例: ステータス列、カテゴリコード、日付部分。
理想的でないシナリオ（潜在的なパフォーマンス低下）:
- ほとんどが一意の値を含む列 (高い NDV)。
- 一意の識別子またはタイムスタンプ。
- 例: ユーザー ID、トランザクション ID。

コンフィグレーション

セッションレベルまたはグローバルレベルでプッシュダウンの最適化を有効にします。

-- Enable regular aggregation pushdown
SET GLOBAL tidb_opt_agg_push_down = ON;

-- Enable distinct aggregation pushdown
SET GLOBAL tidb_opt_distinct_agg_push_down = ON;

バッチ操作中の統計収集を最適化する

統計収集を管理することで、クエリの最適化を維持しながらバッチ操作中のパフォーマンスを最適化できます。このセクションでは、このプロセスを効果的に管理する方法について説明します。

auto analyzeを無効にする場合

次のシナリオでは、システム変数tidb_enable_auto_analyzeをOFFに設定することでauto analyzeを無効にすることができます。

大規模なデータのインポート中。
一括更新操作中。
時間に敏感なバッチ処理用。
統計収集のタイミングを完全に制御する必要がある場合。

ベストプラクティス

バッチ操作の前:

-- Disable auto analyze
SET GLOBAL tidb_enable_auto_analyze = OFF;

バッチ操作後:

-- Manually collect statistics
ANALYZE TABLE your_table;

-- Re-enable auto analyze
SET GLOBAL tidb_enable_auto_analyze = ON;

さまざまなインスタンスタイプに合わせてスレッドプール設定を最適化する

TiKV のパフォーマンスを向上させるには、インスタンスの CPU リソースに基づいてスレッドプールを構成します。次のガイドラインは、これらの設定を最適化するのに役立ちます。

8 ～ 16 個のコアを持つインスタンスの場合、通常はデフォルト設定で十分です。
32 個以上のコアを持つインスタンスの場合は、リソースの使用率を向上させるためにプールサイズを増やします。次のように設定を調整します。
```
[server]
# Increase gRPC thread pool 
grpc-concurrency = 10

[raftstore]
# Optimize for write-intensive workloads
apply-pool-size = 4
store-pool-size = 4
store-io-pool-size = 2
```