主要な指標

TiUPを使用して TiDB クラスターをデプロイすると、監視システム (Prometheus および Grafana) も同時にデプロイされます。詳細については、 TiDB モニタリング フレームワークの概要を参照してください。

Grafana ダッシュボードは、概要、PD、TiDB、TiKV、Node_exporter、Disk Performance、および Performance_overview を含む一連のサブ ダッシュボードに分割されています。診断に役立つ指標が多数あります。

日常的な操作の場合、主要なメトリクスが表示される概要ダッシュボードからコンポーネント(PD、TiDB、TiKV) ステータスとクラスター全体の概要を取得できます。このドキュメントでは、これらの主要な指標について詳しく説明します。

主要な指標の説明

概要ダッシュボードに表示される主要な指標を理解するには、次の表を確認してください。

サービスパネル名説明正常範囲
サービスポートのステータスサービスアップ各サービスのオンラインノード数。
PDPDの役割現PDの役割。
PDストレージ容量TiDB クラスターの合計storage容量。
PD現在のstorageサイズTiKV レプリカが占有するスペースを含む、TiDB クラスターの占有storage容量。
PD通常店舗正常な状態のノードの数。
PD異常店舗異常な状態にあるノードの数。0
PDリージョンの数現在のクラスター内のリージョンの合計数。リージョンの数はレプリカの数とは関係がないことに注意してください。
PD99% completedcmds_durationpd-server リクエストを完了するまでの 99 パーセンタイルの期間。5ms未満
PDHandlerequests_durationPD リクエストのネットワーク継続時間。
PDリージョンの健康各リージョンの状態。一般に、保留中のピアの数は 100 未満であり、不足しているピアの数は常に0より大きいとは限りません。
PDホットライトリージョンのリーダー分布各 TiKV インスタンスの書き込みホットスポットであるリーダーの合計数。
PDホットリードリージョンのリーダー分布各 TiKV インスタンスの読み取りホットスポットであるリーダーの合計数。
PDリージョンハートビートレポートインスタンスごとに PD に報告されたハートビートの数。
PD99%リージョンのハートビートレイテンシーTiKV インスタンスごとのハートビートレイテンシー(P99)。
TiDBステートメントOPS1 秒あたりに実行されるさまざまなタイプの SQL ステートメントの数。 SELECTINSERTUPDATE 、およびその他のタイプのステートメントに従ってカウントされます。
TiDB間隔実行時間。
1. クライアントのネットワーク リクエストが TiDB に送信されてから、TiDB がリクエストを実行した後にリクエストがクライアントに返されるまでの期間。一般に、クライアント要求は SQL ステートメントの形式で送信されます。ただし、この期間にはCOM_PINGCOM_SLEEPCOM_STMT_FETCHCOM_SEND_LONG_DATAなどのコマンドの実行時間が含まれる場合があります。
2. TiDB はマルチクエリをサポートしているため、TiDB は複数の SQL ステートメント ( select 1; select 1; select 1;など) を一度に送信することをサポートしています。この場合、このクエリの合計実行時間には、すべての SQL ステートメントの実行時間が含まれます。
TiDBインスタンス別の CPSCPS By Instance: 各 TiDB インスタンスに関するコマンド統計。コマンド実行結果の成功または失敗に従って分類されます。
TiDB失敗したクエリ OPM各 TiDB インスタンスで 1 秒あたりの SQL ステートメントを実行するときに発生したエラーに基づく、エラー タイプ (構文エラーや主キーの競合など) の統計。エラーが発生したモジュールとエラーコードが含まれます。
TiDB接続数各 TiDB インスタンスの接続番号。
TiDBメモリ使用量各 TiDB インスタンスのメモリ使用量統計。プロセスによって占有されているメモリとGolangによってヒープ上に適用されたメモリに分けられます。
TiDBトランザクションOPS1 秒あたりに実行されるトランザクションの数。
TiDBトランザクション期間トランザクションの実行時間
TiDBKV コマンド OPS実行された KV コマンドの数。
TiDBKV コマンド持続時間 99KVコマンドの実行時間。
TiDBPD TSO OPSTiDB が PD から 1 秒あたりに取得する TSO の数。
TiDBPD TSO 待機時間PD が TSO を返すまで TiDB が待機する期間。
TiDBTiClientリージョンエラー OPSTiKV によって返されたリージョン関連のエラーの数。
TiDBロック解決 OPSロックを解決する TiDB 操作の数。 TiDB の読み取りまたは書き込みリクエストでロックが発生すると、そのロックを解決しようとします。
TiDBKV バックオフ OPSTiKV によって返されたエラーの数。
TiKVリーダー各 TiKV ノード上のリーダーの数。
TiKV領域各 TiKV ノード上のリージョンの数。
TiKVCPU各 TiKV ノードの CPU 使用率。
TiKVメモリー各 TiKV ノードのメモリ使用量。
TiKV店舗サイズ各 TiKV インスタンスによって使用されるstorageスペースのサイズ。
TiKVCFサイズ各カラムファミリー(略して CF) のサイズ。
TiKVチャンネルがいっぱいです各 TiKV インスタンスの「チャネルがいっぱい」エラーの数。0
TiKVサーバーレポートの失敗各 TiKV インスタンスによって報告されたエラー メッセージの数。0
TiKVスケジューラの保留中のコマンド各 TiKV インスタンス上の保留中のコマンドの数。
TiKVコプロセッサー実行数TiKV が受信した 1 秒あたりのコプロセッサー操作の数。コプロセッサーの各タイプは個別にカウントされます。
TiKVコプロセッサー要求期間コプロセッサの読み取りリクエストの処理に費やされた時間。
TiKVRaftストアCPUraftstoreスレッドのCPU使用率デフォルトのスレッド数は 2 です ( raftstore.store-pool-sizeで構成)。単一スレッドの値が 80% を超える場合は、CPU 使用率が非常に高いことを示します。
TiKVコプロセッサーCPUコプロセッサスレッドのCPU使用率。
システム情報VコアCPU コアの数。
システム情報メモリー総メモリ。
システム情報CPU使用率CPU 使用率、最大 100%。
システム情報荷重[1m]1分以内の過負荷。
システム情報使用可能なメモリ使用可能なメモリのサイズ。
システム情報ネットワークトラフィックネットワークトラフィックの統計。
システム情報TCP再送信TOC の再送信の頻度。
システム情報IO使用率ディスク使用率、最大 100%。一般に、使用率が 80% ~ 90% に達した場合は、新しいノードの追加を検討する必要があります。

概要ダッシュボードのインターフェイス

overview

このページは役に立ちましたか?