毎日のチェック

TiDBは分散型データベースであるため、仕組みや監視項目が単体型データベースよりも複雑です。 TiDB をより便利な方法で操作および保守するために、このドキュメントでは主要なパフォーマンス指標をいくつか紹介します。

TiDB ダッシュボードの主な指標

v4.0 から、TiDB は新しい運用および保守管理ツールTiDB ダッシュボードを提供します。このツールは PDコンポーネントに統合されています。デフォルトのアドレスhttp://${pd-ip}:${pd_port}/dashboardで TiDB ダッシュボードにアクセスできます。

TiDB ダッシュボードは、TiDB データベースの操作と保守を簡素化します。 1 つのインターフェイスを介して、TiDB クラスター全体の実行ステータスを表示できます。以下は、いくつかのパフォーマンス指標の説明です。

ステータス: このインジケータは、ステータスが正常かどうかを確認するために使用されます。オンラインノードの場合、これは無視できます。
Up Time : 重要な指標。 Up Timeが変更されていることがわかった場合は、コンポーネントが再起動された理由を特定する必要があります。
Version 、 Deployment Directory 、 Git Hash : これらの指標は、一貫性のない、または誤ったバージョン/展開ディレクトリを避けるためにチェックする必要があります。

CPU、メモリ、およびディスクの使用状況を表示できます。いずれかのリソースの使用率が 80% を超える場合は、それに応じて容量をスケールアウトすることをお勧めします。

クラスターで実行された遅い SQL ステートメントを見つけることができます。次に、特定の SQL ステートメントを最適化できます。

miss-peer-region-count : 十分なレプリカがないリージョンの数。この値は常に0より大きいとは限りません。
extra-peer-region-count : 追加のレプリカを持つリージョンの数。これらのリージョンは、スケジューリングプロセス中に生成されます。
empty-region-count : TRUNCATE TABLE / DROP TABLEステートメントの実行によって生成された空のリージョンの数。この数が大きい場合は、 Region Merge有効にして、テーブル間でリージョンをマージすることを検討できます。
pending-peer-region-count : Raftログが古いリージョンの数。スケジューリングプロセスでいくつかの保留中のピアが生成されるのは正常です。ただし、この値が一定時間（30 分以上）大きい場合は正常ではありません。
down-peer-region-count : Raftリーダーによって報告された応答のないピアを持つリージョンの数。
offline-peer-region-count : オフラインプロセス中のリージョンの数。