TiDB でのディスク I/O 使用率が高い場合のトラブルシューティング

このドキュメントでは、TiDB でのディスク I/O 使用率が高い問題を特定して対処する方法について説明します。

現在のI/Oメトリックを確認する

CPU ボトルネックとトランザクション競合によるボトルネックをトラブルシューティングした後、TiDB の応答が遅くなる場合は、現在のシステムボトルネックを特定するために I/O メトリックを確認する必要があります。

モニターからI/Oの問題を特定する

I/O の問題を見つける最も簡単な方法は、 TiUPによってデフォルトでデプロイされる Grafana ダッシュボードなどのモニターから全体的な I/O ステータスを表示することです。I/O に関連するダッシュボードパネルには、 Overview 、 Node_exporter 、およびDisk-Performanceがあります。

最初のタイプの監視パネル

「概要」 > 「システム情報」 > 「IO 使用率」では、クラスター内の各マシンの I/O ステータスを確認できます。このメトリックは、Linux iostatモニターのutilに似ています。パーセンテージが高いほど、ディスク I/O の使用率が高いことを示します。

モニターで I/O 使用率が高いマシンが 1 台だけの場合、現在このマシンに読み取りおよび書き込みのホットスポットがある可能性があります。
モニター内のほとんどのマシンの I/O 使用率が高い場合、クラスターの I/O 負荷が高くなります。

上記の最初の状況 (I/O 使用率が高いマシンが 1 台のみ) の場合、ディスクパフォーマンスダッシュボードの I/O メトリック ( Disk LatencyやDisk Loadなど) をさらに観察して、異常が存在するかどうかを判断できます。必要に応じて、fio ツールを使用してディスクをチェックします。

2番目のタイプの監視パネル

TiDB クラスターの主なstorageコンポーネントは TiKV です。1 つの TiKV インスタンスには 2 つの RocksDB インスタンスが含まれます。1 つはdata/raftにあるRaftログを保存するためのもので、もう 1 つはdata/dbにある実際のデータを保存するものです。

TiKV-Details > Raft IOでは、次の 2 つのインスタンスのディスク書き込みに関連するメトリックを確認できます。

Append log duration : このメトリックは、 Raftログ.99保存する RockDB への書き込みの応答時間を示します。2 応答時間は 50 ミリ秒以内である必要があります。
Apply log duration : このメトリックは、実際のデータを保存する RockDB への書き込みの応答時間を示します。 .99応答は 100 ミリ秒以内である必要があります。

これら 2 つのメトリックには、書き込みホットスポットを表示するのに役立つサーバーごとの監視パネルもあります。

3番目のタイプの監視パネル

TiKV-Details > Storageには、storageに関連する監視メトリックがあります。

Storage command total : 受信した異なるコマンドの数を示します。
Storage async write duration : disk sync durationなどのRaft I/O に関連する可能性のある監視メトリックが含まれます。異常な状況が発生した場合は、ログを確認して関連コンポーネントの動作状態を確認してください。

その他のパネル

さらに、他のパネルメトリックは、ボトルネックが I/O であるかどうかを判断するのに役立つ場合があり、いくつかのパラメータを設定することもできます。TiKV gRPC 期間の prewrite/commit/raw-put (raw キー値クラスターのみ) を確認することで、ボトルネックが確かに遅い TiKV 書き込みであることを判断できます。遅い TiKV 書き込みの一般的な状況は次のとおりです。

append logは遅いです。TiKV Grafana のRaft I/Oとappend log durationメトリックは比較的高く、これは多くの場合、ディスク書き込みが遅いことが原因です。RocksDB -raftでWAL Sync Duration maxの値をチェックして、遅いappend logの原因を特定できます。それ以外の場合は、バグを報告する必要があるかもしれません。
raftstoreスレッドはビジーです。TiKV Grafana では、 Raft Propose / propose wait duration append log durationよりも大幅に高くなっています。トラブルシューティングのために次の点を確認してください。
- [raftstore]のうちstore-pool-sizeの値が小さすぎるかどうか。この値は[1,5]から大きすぎない範囲に設定することをお勧めします。
- マシンのCPUリソースが不足しているかどうか。
apply logは遅いです。TiKV Grafana のRaft I/Oとapply log durationメトリックは比較的高く、通常は比較的高いRaft Propose / apply wait durationとともに発生する可能性があります。考えられる原因は次のとおりです。
- apply-pool-sizeの値は小さすぎます。この値は[1, 5]から大きすぎない範囲[raftstore]設定することをお勧めしますThread CPU / apply cpuの値も比較的高いです。
- マシンの CPU リソースが不足しています。
- 単一リージョンの書き込みホットスポットの問題 (現在、この問題の解決はまだ進行中です)。単一applyスレッドの CPU 使用率が高くなっています (これは、Grafana 式を変更してby (instance, name)を追加することで確認できます)。
- RocksDB への書き込みが遅く、 RocksDB kv / max write duration高いです。1 つのRaftログに複数のキーと値のペア (kv) が含まれる場合があります。128 の kv が一括で RocksDB に書き込まれるため、1 つのapplyログに複数の RocksDB 書き込みが含まれる可能性があります。
- その他の原因の場合は、バグとして報告してください。
raft commit logは遅いです。TiKV Grafana では、 Raft I/Oとcommit log duration (Grafana 4.x でのみ使用可能) のメトリックは比較的高くなっています。各リージョンは独立したRaftグループに対応しています。Raftには、TCP のスライディングウィンドウメカニズムに似たフロー制御メカニズムがあります。スライディングウィンドウのサイズを制御するには、 [raftstore] raft-max-inflight-msgsパラメータを調整します。書き込みホットスポットがあり、 commit log durationが高い場合は、このパラメータを1024などのより大きな値に設定できます。

ログからI/Oの問題を特定する

クライアントがserver is busyや特にraftstore is busyなどのエラーを報告する場合、エラーは I/O の問題に関連している可能性があります。
監視パネル ( Grafana -> TiKV ->エラー) をチェックして、 busyエラーの具体的な原因を確認できますserver is busyは TiKV のフロー制御メカニズムです。このようにして、TiKV はtidb/ti-client 、TiKV の現在の圧力が高すぎるため、クライアントは後で再試行する必要があることを通知します。
TiKV RocksDB ログにWrite stall表示されます。
レベル 0 SST ファイルが多すぎると、書き込みが停止する可能性があります。この問題に対処するには、 [rocksdb] max-sub-compactions = 2 (or 3)パラメータを追加して、レベル 0 SST ファイルの圧縮を高速化できます。このパラメータは、レベル 0 からレベル 1 への圧縮タスクをmax-sub-compactionsサブタスクに分割して、マルチスレッドの同時実行ができることを意味します。
ディスクの I/O 能力が書き込みに追いつかない場合は、ディスクをスケールアップすることをお勧めします。ディスクのスループットが上限に達し (たとえば、SATA SSD のスループットが NVMe SSD のスループットよりはるかに低い)、書き込みが停止するが、CPU リソースが比較的十分な場合は、より高い圧縮率の圧縮アルゴリズムを使用してディスクの負荷を軽減し、CPU リソースを使用してディスクリソースを補うことができます。
例えば、 default cf compactionの圧力が比較的高い場合は、パラメータ[rocksdb.defaultcf] compression-per-level = ["no", "no", "lz4", "lz4", "lz4", "zstd", "zstd"] compression-per-level = ["no", "no", "zstd", "zstd", "zstd", "zstd", "zstd"]に変更できます。

アラートでI/Oの問題が見つかりました

クラスターデプロイメントツール (TiUP) は、アラート項目としきい値が組み込まれたアラートコンポーネントをデフォルトで使用してクラスターをデプロイします。次のアラート項目は I/O に関連しています。

TiKV_書き込みストール
TiKV_ラフトログラグ
TiKVasync_requestスナップショット継続時間秒
TiKV_async_request_write_duration_seconds
TiKV_raft_append_log_duration_secs
TiKV_raft_apply_log_duration_secs

I/Oの問題を処理する

I/O ホットスポットの問題が発生したことが確認された場合は、「TiDB ホットスポットの問題の処理」を参照して I/O ホットスポットを排除する必要があります。
全体的な I/O パフォーマンスがボトルネックになっていることが確認され、アプリケーション側で I/O パフォーマンスが低下し続けると判断できる場合は、分散データベースのスケーリング機能を活用し、TiKV ノードの数を増やして全体的な I/O スループットを向上させることができます。
上記のようにいくつかのパラメータを調整し、コンピューティング/メモリリソースを使用してディスクstorageリソースを補います。