重要
このページは英語版のページを機械翻訳しています。原文はこちらからご覧ください。

主要な指標

TiUPを使用してTiDBクラスタをデプロイする場合、監視システム(Prometheus&Grafana)も同時にデプロイされます。詳細については、 TiDBモニタリングフレームワークの概要を参照してください。

Grafanaダッシュボードは、Overview、PD、TiDB、TiKV、Node_exporter、Disk Performance、Performance_overviewなどを含む一連のサブダッシュボードに分割されています。診断に役立つ多くのメトリックがあります。

日常業務の場合、主要なメトリックが表示される概要ダッシュボードから、コンポーネント(PD、TiDB、TiKV)のステータスとクラスタ全体の概要を取得できます。このドキュメントでは、これらの主要な指標について詳しく説明します。

主な指標の説明

概要ダッシュボードに表示される主要なメトリックを理解するには、次の表を確認してください。

サービスパネル名説明正常範囲
サービスポートステータスサービスアップ各サービスのオンラインノード番号。
PDPDの役割現在のPDの役割。
PDストレージ容量TiDBクラスタの合計ストレージ容量。
PD現在のストレージサイズTiKVレプリカが占有するスペースを含む、TiDBクラスタの占有ストレージ容量。
PD普通店通常状態のノードの数。
PD異常な店異常状態のノードの数。0
PD地域の数現在のクラスタのリージョンの総数。リージョンの数はレプリカの数とは関係がないことに注意してください。
PD99%完了_cmds_duration_secondspd-serverリクエストを完了するための99パーセンタイル期間。5ミリ秒未満
PDHandle_requests_duration_secondsPD要求のネットワーク期間。
PDリージョンの健康各リージョンの状態。一般に、保留中のピアの数は100未満であり、欠落しているピアの数は常に0を超えるとは限りません。
PDホットライトリージョンのリーダーディストリビューション各TiKVインスタンスの書き込みホットスポットであるリーダーの総数。
PDホットリードリージョンのリーダーディストリビューション各TiKVインスタンスの読み取りホットスポットであるリーダーの総数。
PDリージョンハートビートレポートインスタンスごとにPDに報告されたハートビートの数。
PD99%のリージョンハートビートレイテンシTiKVインスタンスごとのハートビート待ち時間(P99)。
TiDBステートメントOPSINSERT秒あたりに実行されるさまざまなタイプのSQLステートメントの数。これは、 SELECT 、およびその他のタイプのステートメントに従ってカウントされUPDATE
TiDB間隔実行時間。
1.クライアントのネットワーク要求がTiDBに送信されてから、TiDBが要求を実行した後に要求がクライアントに返されるまでの時間。一般に、クライアント要求はSQLステートメントの形式で送信されます。ただし、この期間には、 COM_PINGなどのCOM_STMT_FETCHの実行時間をCOM_SEND_LONG_DATAことができCOM_SLEEP
2. TiDBはマルチクエリをサポートしているため、TiDBはselect 1; select 1; select 1;などの複数のSQLステートメントを一度に送信することをサポートしています。この場合、このクエリの合計実行時間には、すべてのSQLステートメントの実行時間が含まれます。
TiDBインスタンス別のCPSインスタンス別のCPS:各TiDBインスタンスのコマンド統計。コマンド実行結果の成功または失敗に応じて分類されます。
TiDB失敗したクエリOPM各TiDBインスタンスで1秒あたりのSQLステートメントを実行するときに発生したエラーに基づくエラータイプ(構文エラーや主キーの競合など)の統計。エラーが発生したモジュールとエラーコードが含まれています。
TiDB接続数各TiDBインスタンスの接続番号。
TiDBメモリ使用量各TiDBインスタンスのメモリ使用統計。これは、プロセスによって占有されているメモリと、ヒープ上でGolangによって適用されているメモリに分割されます。
TiDBトランザクションOPS1秒あたりに実行されたトランザクションの数。
TiDBトランザクション期間トランザクションの実行時間
TiDBKV Cmd OPS実行されたKVコマンドの数。
TiDBKVCmd期間99KVコマンドの実行時間。
TiDBPD TSO OPSTiDBが1秒あたりPDから取得するTSOの数。
TiDBPDTSO待機時間TiDBがPDがTSOを返すのを待機する期間。
TiDBTiClientリージョンエラーOPSTiKVによって返されたリージョン関連のエラーの数。
TiDBロック解決OPSロックを解決するTiDB操作の数。 TiDBの読み取りまたは書き込み要求でロックが発生すると、ロックを解決しようとします。
TiDBKVバックオフOPSTiKVによって返されたエラーの数。
TiKV盟主各TiKVノードのリーダーの数。
TiKV領域各TiKVノードのリージョンの数。
TiKVCPU各TiKVノードのCPU使用率。
TiKVメモリー各TiKVノードのメモリ使用量。
TiKV店舗サイズ各TiKVインスタンスによって使用されるストレージスペースのサイズ。
TiKVcfサイズ各列ファミリーのサイズ(略してCF)。
TiKVチャンネルがいっぱい各TiKVインスタンスでの「チャネルフル」エラーの数。0
TiKVサーバーレポートの障害各TiKVインスタンスによって報告されたエラーメッセージの数。0
TiKVスケジューラ保留中のコマンド各TiKVインスタンスで保留中のコマンドの数。
TiKVコプロセッサーエグゼキューター数1秒あたりにTiKVが受信したコプロセッサー操作の数。コプロセッサーの各タイプは個別にカウントされます。
TiKVコプロセッサー要求期間コプロセッサーの読み取り要求の処理にかかる時間。
TiKVいかだ店CPUraftstoreスレッドのCPU使用率デフォルトのスレッド数は2です( raftstore.store-pool-sizeで構成されます)。シングルスレッドの値が80%を超える場合は、CPU使用率が非常に高いことを示しています。
TiKVコプロセッサーCPUコプロセッサースレッドのCPU使用率。
システム情報VcoresCPUコアの数。
システム情報メモリー総メモリ。
システム情報CPU使用率CPU使用率、最大100%。
システム情報負荷[1m]1分以内の過負荷。
システム情報使用可能なメモリ使用可能なメモリのサイズ。
システム情報ネットワークトラフィックネットワークトラフィックの統計。
システム情報TCPリトランスTOC再送信の頻度。
システム情報IO Utilディスク使用率、最大100%。通常、使用率が最大80%〜90%の場合は、新しいノードの追加を検討する必要があります。

概要ダッシュボードのインターフェース

overview