毎日のチェック

TiDB は分散型データベースであるため、スタンドアロン型データベースに比べて仕組みや監視項目が複雑になります。 TiDB をより便利な方法で運用および保守できるように、このドキュメントではいくつかの重要なパフォーマンス指標を紹介します。

TiDB ダッシュボードの主要な指標

TiDB は v4.0 から、新しい運用および保守管理ツールTiDB ダッシュボードを提供します。このツールは PDコンポーネントに統合されています。 TiDB ダッシュボードにはデフォルトのアドレスhttp://${pd-ip}:${pd_port}/dashboardでアクセスできます。

TiDB ダッシュボードは、TiDB データベースの運用とメンテナンスを簡素化します。 1 つのインターフェイスを通じて TiDB クラスター全体の実行ステータスを表示できます。以下に、いくつかのパフォーマンス指標について説明します。

ステータス: ステータスが正常かどうかを確認するために使用されます。オンラインノードの場合、これは無視できます。
稼働時間: 重要な指標。 Up Timeが変更されたことがわかった場合は、コンポーネントが再起動された理由を特定する必要があります。
バージョン、デプロイメントディレクトリ、 Git ハッシュ: これらのインジケーターは、バージョン/デプロイメントディレクトリの不一致や不正確を避けるためにチェックする必要があります。

CPU、メモリ、ディスクの使用状況を表示できます。リソースの使用率が 80% を超えた場合は、それに応じて容量をスケールアウトすることをお勧めします。

クラスター内で実行された遅い SQL ステートメントを見つけることができます。その後、特定の SQL ステートメントを最適化できます。

miss-peer-region-count : 十分なレプリカがないリージョンの数。この値は常に0より大きいとは限りません。
extra-peer-region-count : 追加のレプリカを持つリージョンの数。これらの領域は、スケジューリングプロセス中に生成されます。
empty-region-count : TRUNCATE TABLE / DROP TABLEステートメントの実行によって生成される空のリージョンの数。この数が大きい場合は、 Region Merge有効にしてテーブル全体のリージョンをマージすることを検討できます。
pending-peer-region-count : 古いRaftログを持つリージョンの数。スケジューリングプロセスでいくつかの保留ピアが生成されるのは正常です。ただし、この値が一定期間 (30 分を超えて) 大きくなる場合は異常ではありません。
down-peer-region-count : Raftリーダーによって報告された、応答しないピアのあるリージョンの数。
offline-peer-region-count : オフラインプロセス中のリージョンの数。