TiDB Cloud組み込みメトリクス
TiDB Cloudは、クラスターの標準メトリクスを一通り収集し、「メトリクス」ページに表示します。これらのメトリクスを表示することで、パフォーマンスの問題を簡単に特定し、現在のデータベース環境が要件を満たしているかどうかを判断できます。
メトリクスページをビュー
「メトリクス」ページでメトリクスを表示するには、次の手順を実行します。
プロジェクトのクラスターページで、ターゲット クラスターの名前をクリックして、概要ページに移動します。
ヒント:
左上隅のコンボ ボックスを使用して、組織、プロジェクト、クラスターを切り替えることができます。
左側のナビゲーション ペインで、 [監視] > [メトリック]をクリックします。
メトリクス保持ポリシー
TiDB Cloudクラスターの場合、メトリック データは 7 日間保持されます。
TiDB Cloud Dedicated クラスタのメトリクス
次のセクションでは、 TiDB Cloud Dedicated クラスターのメトリックページのメトリックについて説明します。
概要
| メトリック名 | ラベル | 説明 | 
|---|---|---|
| SQLタイプ別のデータベース時間 | データベース時間、{SQLタイプ} | データベース時間: 1 秒あたりの合計データベース時間。 {SQL タイプ}: 1 秒あたりに SQL ステートメントによって消費されたデータベース時間 SELECTなどの SQL INSERT UPDATEに収集されます。 | 
| 1秒あたりのクエリ数 | {SQL タイプ} | すべての TiDB インスタンスで 1 秒あたりに実行された SQL ステートメントの数SELECTなどの SQL INSERT UPDATEに収集されます。 | 
| クエリ期間 | 平均-{SQLタイプ}、99-{SQLタイプ} | クライアントからのリクエストをTiDBが受信してから、TiDBがそのリクエストを実行し、結果をクライアントに返すまでの時間です。通常、クライアントからのリクエストはSQL文の形式で送信されますが、この時間にはCOM_PING 、 COM_SLEEP 、 COM_STMT_FETCH 、 COM_SEND_LONG_DATAなどのコマンドの実行時間も含まれる場合があります。TiDBはマルチクエリをサポートしており、クライアントはselect 1; select 1; select 1;などの複数のSQL文を一度に送信できます。この場合、このクエリの合計実行時間には、すべてのSQL文の実行時間が含まれます。 | 
| 失敗したクエリ | すべて、{エラータイプ} @ {インスタンス} | 各TiDBインスタンスにおける1分あたりのSQL文実行エラー数に基づく、エラーの種類(構文エラーや主キーの競合など)の統計情報。エラーが発生したモジュールとエラーコードが含まれます。 | 
| 1秒あたりのコマンド数 | クエリ、StmtExecute、および StmtPrepare | コマンドの種類に基づいて、すべての TiDB インスタンスによって 1 秒あたりに処理されるコマンドの数。 | 
| プランキャッシュOPSを使用したクエリ | ヒット、ミス | ヒット: すべての TiDB インスタンスで 1 秒あたりにプラン キャッシュを使用するクエリの数。 ミス: すべての TiDB インスタンスで 1 秒あたりにプラン キャッシュが欠落しているクエリの数。  | 
| 1秒あたりのトランザクション | {タイプ}-{トランザクション モデル} | 1 秒あたりに実行されるトランザクションの数。 | 
| トランザクション期間 | 平均-{トランザクション モデル}、99-{トランザクション モデル} | トランザクションの平均期間または 99 パーセンタイル期間。 | 
| 接続数 | すべて、アクティブな接続 | すべて: すべての TiDB インスタンスへの接続数。 アクティブ接続: すべての TiDB インスタンスへのアクティブな接続の数。  | 
| 切断回数 | {インスタンス}-{結果} | 各 TiDB インスタンスから切断されたクライアントの数。 | 
高度な
| メトリック名 | ラベル | 説明 | 
|---|---|---|
| 平均アイドル接続時間 | 平均トランザクション内、平均トランザクション外 | 接続アイドル期間は、接続がアイドル状態にある期間を示します。 avg-in-txn: 接続がトランザクション内にあるときの平均接続アイドル期間。 avg-not-in-txn: 接続がトランザクション内にない場合の平均接続アイドル期間。  | 
| トークンの有効期限を取得する | 平均、99 | SQL ステートメントのトークンを取得するのに費やされた平均または 99 パーセンタイル期間。 | 
| 解析期間 | 平均、99 | SQL ステートメントの解析に費やされた平均または 99 パーセンタイル期間。 | 
| コンパイル時間 | 平均、99 | 解析された SQL AST を実行プランにコンパイルするのに要した平均時間または 99 パーセンタイル時間。 | 
| 実行時間 | 平均、99 | SQL ステートメントの実行プランの実行に費やされた平均または 99 パーセンタイル期間。 | 
| 平均 TiDB KV リクエスト期間 | {リクエストタイプ} | Get 、 Prewrite 、 Commitなどのリクエスト タイプに基づいて、すべての TiDB インスタンスで KV リクエストの実行に費やされた平均時間。 | 
| 平均 TiKV gRPC 期間 | {リクエストタイプ} | kv_get 、 kv_prewrite 、 kv_commitなどのリクエスト タイプに基づいて、すべての TiKV インスタンスで gRPC リクエストの実行に費やされた平均時間。 | 
| 平均 / P99 PD TSO 待機/RPC 期間 | 待機平均/99、rpc平均/99 | 待機: すべての TiDB インスタンスで PD が TSO を返すのを待機する平均期間または 99 パーセンタイル期間。 RPC: すべての TiDB インスタンスで TSO 要求を PD に送信してから TSO を受信するまでの平均時間または 99 パーセンタイル。  | 
| 平均 / P99 ストレージ非同期書き込み時間 | 平均、99 | 非同期書き込みに費やされた平均時間または99パーセンタイル時間。平均storage非同期書き込み時間 = 平均ストア時間 + 平均適用時間。 | 
| 平均 / P99 ストア期間 | 平均、99 | 非同期書き込み中にループの保存に費やされた平均または 99 パーセンタイル期間。 | 
| 平均 / P99 適用期間 | 平均、99 | 非同期書き込み中にループを適用するのに費やされた平均または 99 パーセンタイル期間。 | 
| 平均 / P99 追加ログ期間 | 平均、99 | Raftがログを追加するために要した平均または 99 パーセンタイル期間。 | 
| 平均 / P99 コミットログ期間 | 平均、99 | Raftがログをコミットするのにかかる平均または 99 パーセンタイル期間。 | 
| 平均 / P99 適用ログ期間 | 平均、99 | Raftがログを適用するために要した平均または 99 パーセンタイル期間。 | 
| 影響を受ける行 | {SQL タイプ} | SQL タイプ別に 1 秒あたりに処理される行数。 | 
| Leader数 | {実例} | TiKV ノードによってホストされるRaftリーダー領域の数。 | 
| リージョン数 | {実例} | TiKV ノードによって管理されるデータ領域の合計。 | 
サーバ
| メトリック名 | ラベル | 説明 | 
|---|---|---|
| TiDB の稼働時間 | ノード | 前回の再起動以降の各 TiDB ノードの実行時間。 | 
| TiDB CPU 使用率 | ノード、制限 | 各 TiDB ノードの CPU 使用率統計または上限。 | 
| TiDB メモリ使用量 | ノード、制限 | 各 TiDB ノードのメモリ使用量の統計または上限。 | 
| TiKV稼働時間 | ノード | 前回の再起動以降の各 TiKV ノードの実行時間。 | 
| TiKV CPU 使用率 | ノード、制限 | 各 TiKV ノードの CPU 使用率統計または上限。 | 
| TiKV メモリ使用量 | ノード、制限 | 各 TiKV ノードのメモリ使用量の統計または上限。 | 
| TiKV IO Bps | ノード書き込み、ノード読み取り | 各 TiKV ノードでの読み取りおよび書き込みの 1 秒あたりの合計入出力バイト数。 | 
| TiKV ストレージ使用量 | ノード、制限 | 各 TiKV ノードのstorage使用状況統計または上限。 | 
| TiFlashの稼働時間 | ノード | 前回の再起動以降の各TiFlashノードの実行時間。 | 
| TiFlash CPU 使用率 | ノード、制限 | 各TiFlashノードの CPU 使用率統計または上限。 | 
| TiFlashメモリ使用量 | ノード、制限 | 各TiFlashノードのメモリ使用量の統計または上限。 | 
| TiFlash IO MBps | ノード書き込み、ノード読み取り | 各TiFlashノードでの読み取りおよび書き込みの合計バイト数。 | 
| TiFlashストレージ使用量 | ノード、制限 | 各TiFlashノードのstorage使用状況統計または上限。 | 
TiDB Cloud Starter およびTiDB Cloud Essential クラスターのメトリクス
メトリクスページには、TiDB Cloud Starter クラスターとTiDB Cloud Essential クラスターのメトリクス用の 2 つのタブがあります。
- クラスタステータス: クラスター レベルの主なメトリックを表示します。
 - データベース ステータス: データベース レベルの主なメトリックを表示します。
 
クラスタステータス
次の表は、 「クラスタステータス」タブのクラスター レベルの主なメトリックを示しています。
| メトリック名 | ラベル | 説明 | 
|---|---|---|
| リクエストユニット | RU/秒 | リクエストユニット(RU)は、 TiDB Cloud Starterクラスターにおけるクエリまたはトランザクションのリソース消費量を追跡するために使用される測定単位です。ユーザークエリに加えて、バックグラウンドアクティビティもRUを消費するため、QPSが0の場合でも、1秒あたりのRU使用量は0ではない可能性があります。 | 
| 容量と使用量(RU/秒) | プロビジョニングされた容量 (RCU)、消費された RU/秒 | TiDB Cloud Essential クラスター内の 1 秒あたりのリクエスト容量単位 (RCU) と消費されたリクエスト単位 (RU)。 | 
| 使用済みストレージサイズ | 行ベースstorage、列ベースstorage | 行ストアのサイズと列ストアのサイズ。 | 
| 1秒あたりのクエリ数 | すべて、{SQL タイプ} | 1 秒あたりに実行された SQL ステートメントの数。1 、 SELECT 、 UPDATEなどの SQL INSERT別に収集されます。 | 
| クエリ期間 | 平均、P99、P99-{SQL タイプ} | TiDB Cloud Starter またはTiDB Cloud Essential クラスターへのクライアントからのリクエストを受信してから、クラスターがリクエストを実行して結果をクライアントに返すまでの期間。 | 
| 失敗したクエリ | 全て | 1 秒あたりの SQL ステートメント実行エラーの数。 | 
| 1秒あたりのトランザクション | 全て | 1 秒あたりに実行されるトランザクションの数。 | 
| トランザクション期間 | 平均、P99 | トランザクションの実行期間。 | 
| ロック待機 | P95、P99 | トランザクションが悲観的ロックの取得を待機する時間。値が高い場合、同じ行またはキーで競合が発生していることを示します。 | 
| トータルコネクション | 全て | TiDB Cloud Starter またはTiDB Cloud Essential クラスターへの接続数。 | 
| アイドル接続期間 | P99、P99(トランザクション内)、P99(トランザクション外) | オープントランザクション中に接続がアイドル状態のままである時間。この時間が長い場合、通常、アプリケーションロジックが遅いか、トランザクションの実行時間が長いことを示します。 | 
データベースのステータス
次の表は、「データベース ステータス」タブのデータベース レベルの主なメトリックを示しています。
| メトリック名 | ラベル | 説明 | 
|---|---|---|
| DBあたりのQPS | すべて、{データベース名} | 各データベースで 1 秒あたりに実行された SQL ステートメントの数SELECT 、 INSERT 、 UPDATEなどの SQL タイプ別に収集されます。 | 
| DBあたりの平均クエリ実行時間 | すべて、{データベース名} | クライアントからデータベースへのリクエストを受信してから、データベースがリクエストを実行し、結果をクライアントに返すまでの期間。 | 
| DBごとの失敗したクエリ | すべて、{データベース名} | 各データベースにおける 1 秒あたりの SQL ステートメント実行エラーに応じたエラー タイプの統計。 | 
FAQ
1. このページの一部のペインが空になっているのはなぜですか?
ペインにメトリックが表示されない場合は、次のような理由が考えられます。
- 対応するクラスターのワークロードは、このメトリックをトリガーしません。たとえば、失敗したクエリがない場合、失敗したクエリのメトリックは常に空になります。
 - クラスターのバージョンが低いです。これらのメトリクスを表示するには、TiDB の最新バージョンにアップグレードする必要があります。
 
これらすべての理由が除外される場合は、トラブルシューティングのためにPingCAPサポートチーム問い合わせることができます。
2. まれにメトリックが不連続になることがあるのはなぜですか?
まれに、メトリクス システムに高い負荷がかかった場合など、メトリクスが失われる場合があります。
この問題が発生した場合は、トラブルシューティングのためにPingCAP サポートお問い合わせください。