📣
TiDB Cloud Essential はパブリックプレビュー中です。このページは自動翻訳されたものです。原文はこちらからご覧ください。

主要な指標

TiUPを使用してTiDBクラスターをデプロイする場合、監視システム(PrometheusとGrafana)も同時にデプロイされます。詳細については、 TiDB 監視フレームワークの概要参照してください。

Grafanaダッシュボードは、Overview、PD、TiDB、TiKV、Node_exporter、Disk Performance、Performance_overviewといった一連のサブダッシュボードに分かれています。診断に役立つ多くの指標が用意されています。

日常的な運用では、主要なメトリクスが表示される「概要」ダッシュボードから、コンポーネント(PD、TiDB、TiKV)のステータスとクラスタ全体の概要を確認できます。このドキュメントでは、これらの主要なメトリクスについて詳しく説明します。

主要な指標の説明

概要ダッシュボードに表示される主要な指標を理解するには、次の表を確認してください。

サービスパネル名説明正常範囲
サービスポートのステータスサービスアップ各サービスのオンライン ノード数。
PDPDの役割現在のPDの役割。
PDストレージ容量TiDB クラスターの合計storage容量。
PD現在のstorageサイズTiKV レプリカによって占有されるスペースを含む、TiDB クラスターの占有storage容量。
PD通常の店舗正常状態にあるノードの数。
PD異常な店舗異常状態にあるノードの数。0
PD地域数現在のクラスター内のリージョンの合計数。リージョンの数はレプリカの数とは関係ありません。
PD99% 完了コマンド実行時間秒数pd-server 要求を完了するまでの 99 パーセンタイル期間。5ミリ秒未満
PD処理リクエストの所要時間(秒)PD 要求のネットワーク期間。
PDリージョンの健康各リージョンの状態。通常、保留中のピアの数は 100 未満であり、不足しているピアの数は必ずしも0を超えるとは限りません。
PDホットライトリージョンのリーダー分布各 TiKV インスタンスの書き込みホットスポットであるリーダーの合計数。
PDホットリード地域のリーダー分布各 TiKV インスタンス上の読み取りホットスポットであるリーダーの合計数。
PDリージョンのハートビートレポートインスタンスごとに PD に報告されたハートビートの数。
PD99%リージョンハートビートレイテンシーTiKV インスタンスごとのハートビートレイテンシー(P99)。
TiDBステートメントOPS1 秒あたりに実行される異なるタイプの SQL ステートメントの数。1 、 SELECTUPDATEなどINSERTステートメントのタイプに応じてカウントされます。
TiDB間隔実行時間。
1. クライアントのネットワーク要求がTiDBに送信されてから、TiDBが要求を実行した後にクライアントに返されるまでの時間。通常、クライアント要求はSQL文の形式で送信されますが、この時間にはCOM_PINGCOM_SLEEPCOM_STMT_FETCHCOM_SEND_LONG_DATAなどのコマンドの実行時間も含まれる場合があります。
2. TiDBはマルチクエリをサポートしているため、 select 1; select 1; select 1;ように複数のSQL文を一度に送信できます。この場合、このクエリの合計実行時間には、すべてのSQL文の実行時間が含まれます。
TiDBインスタンスごとのCPSインスタンス別 CPS: コマンド実行結果の成功または失敗に応じて分類された、各 TiDB インスタンスのコマンド統計。
TiDBクエリ OPM の失敗各TiDBインスタンスにおける1秒あたりのSQL文実行時に発生したエラー数に基づく、エラーの種類(構文エラーや主キーの競合など)の統計情報。エラーが発生したモジュールとエラーコードが含まれます。
TiDB接続数各 TiDB インスタンスの接続数。
TiDBメモリ使用量各 TiDB インスタンスのメモリ使用量統計。プロセスによって占有されるメモリと、ヒープ上でGolangによって適用されたメモリに分割されます。
TiDBトランザクションOPS1 秒あたりに実行されるトランザクションの数。
TiDBトランザクション期間トランザクションの実行時間
TiDBKVコマンドオペレーション実行された KV コマンドの数。
TiDBKVコマンド持続時間99KV コマンドの実行時間。
TiDBPD TSOオペレーションTiDB が PD に送信する 1 秒あたりの gRPC 要求の数 (cmd) と TSO 要求の数 (request)。各 gRPC 要求には、TSO 要求のバッチが含まれます。
TiDBPD TSO 待機時間TiDB が PD から TSO が返されるのを待機する期間。
TiDBTiClientリージョンエラー OPSTiKV によって返されたリージョン関連エラーの数。
TiDBロック解決OPSロックを解決したTiDB操作の数。TiDBの読み取りまたは書き込み要求がロックに遭遇すると、TiDBはロックを解決しようとします。
TiDBKV バックオフ OPSTiKV によって返されたエラーの数。
TiKVリーダー各 TiKV ノード上のリーダーの数。
TiKV地域各 TiKV ノード上のリージョンの数。
TiKVCPU各 TiKV ノード上の CPU 使用率。
TiKVメモリ各 TiKV ノードのメモリ使用量。
TiKV店舗規模各 TiKV インスタンスによって使用されるstorageスペースのサイズ。
TiKVcfサイズ各カラムファミリー(略して CF) のサイズ。
TiKVチャンネルがいっぱい各 TiKV インスタンスでの「チャネルがいっぱい」エラーの数。0
TiKVサーバーレポートの失敗各 TiKV インスタンスによって報告されたエラー メッセージの数。0
TiKVスケジューラ保留コマンド各 TiKV インスタンス上の保留中のコマンドの数。
TiKVコプロセッサ実行者数TiKVが1秒あたりに受信したコプロセッサ操作の数。コプロセッサの種類ごとに個別にカウントされます。
TiKVコプロセッサ要求期間コプロセッサの読み取り要求を処理するのに費やされた時間。
TiKVいかだストアCPUraftstoreスレッドのCPU使用率デフォルトのスレッド数は2( raftstore.store-pool-sizeで設定)です。1つのスレッドの値が80%を超える場合、CPU使用率が非常に高いことを示します。
TiKVコプロセッサーCPUコプロセッサ スレッドの CPU 使用率。
システム情報VコアCPU コアの数。
システム情報メモリ合計メモリ。
システム情報CPU使用率CPU使用率、最大100%。
システム情報荷重 [1m]1分以内に過負荷になります。
システム情報使用可能なメモリ使用可能なメモリのサイズ。
システム情報ネットワークトラフィックネットワーク トラフィックの統計。
システム情報TCP再送信TOC 再送信の頻度。
システム情報IO使用率ディスク使用率は最大でも 100% ですが、一般的には使用率が 80% ~ 90% までになると新しいノードの追加を検討する必要があります。

概要ダッシュボードのインターフェース

overview

このページは役に立ちましたか?