重要
このページは英語版のページを機械翻訳しています。原文はこちらからご覧ください。

TiCDCの主要な監視指標

TiUPを使用してTiDBクラスタを展開する場合、同時に展開される監視システムにTiCDCのサブダッシュボードが表示されます。主要なメトリックが表示されるTiCDCダッシュボードから、TiCDCの現在のステータスの概要を取得できます。このドキュメントでは、これらの主要な指標について詳しく説明します。

このドキュメントのメトリックの説明は、デフォルト構成を使用してデータをMySQLにレプリケートする次のレプリケーションタスクの例に基づいています。

cdc cli changefeed create --pd=http://10.0.10.25:2379 --sink-uri="mysql://root:123456@127.0.0.1:3306/" --changefeed-id="simple-replication-task"

TiCDCダッシュボードには、4つの監視パネルが含まれています。次のスクリーンショットを参照してください。

TiCDC Dashboard - Overview

各パネルの説明は次のとおりです。

  • サーバ :TiDBクラスタのTiKVノードとTiCDCノードの概要情報
  • チェンジフィード :TiCDCレプリケーションタスクの詳細情報
  • イベント :TiCDCクラスタ内のデータフローに関する詳細情報
  • TiKV :TiCDCに関連するTiKV情報

サーバ

以下は、サーバーパネルの例です。

TiCDC Dashboard - Server metrics

サーバーパネルの各メトリックの説明は次のとおりです。

  • 稼働時間:TiKVノードとTiCDCノードが実行されている時間
  • ゴルーチン数:TiCDCノードのゴルーチンの数
  • オープンFDカウント:TiCDCノードによって開かれたファイルハンドルの数
  • 所有権:TiCDCクラスタのノードの現在のステータス
  • 所有履歴:TiCDCクラスタの所有履歴
  • CPU使用率:TiCDCノードのCPU使用率
  • メモリ使用量:TiCDCノードのメモリ使用量

チェンジフィード

以下は、チェンジフィードパネルの例です。

TiCDC Dashboard - Changefeed metrics 1 TiCDC Dashboard - Changefeed metrics 2 TiCDC Dashboard - Changefeed metrics 3

[チェンジフィード]パネルの各メトリックの説明は次のとおりです。

  • チェンジフィードテーブル数:各TiCDCノードがレプリケーションタスクでレプリケートする必要があるテーブルの数
  • プロセッサー解決済みts:TiCDCクラスタで解決されたタイムスタンプ
  • テーブル解決済みts:レプリケーションタスク内の各テーブルのレプリケーションの進行状況
  • チェンジフィードチェックポイント:データをダウンストリームに複製する進行状況。通常、緑色のバーは黄色の線に接続されています
  • PD etcdリクエスト/秒:TiCDCノードが1秒あたりにPDに送信するリクエストの数
  • 終了エラー数:1分あたりのレプリケーションタスクを中断するエラーの数
  • チェンジフィードチェックポイントラグ:アップストリームとダウンストリーム間のデータレプリケーションの進行ラグ(単位は秒)
  • チェンジフィードで解決されたtslag:アップストリームノードとTiCDCノード間のデータレプリケーションの進行ラグ(単位は2番目)
  • フラッシュシンク期間:TiCDCがデータをダウンストリームに非同期的にフラッシュするために費やした時間のヒストグラム
  • フラッシュシンク期間パーセンタイル:TiCDCが1秒以内にデータをダウンストリームに非同期にフラッシュするために費やした時間(P95、P99、およびP999)
  • シンク書き込み期間:TiCDCがダウンストリームへのトランザクション変更の書き込みに費やした時間のヒストグラム
  • シンク書き込み期間パーセンタイル:TiCDCが1秒以内にダウンストリームへのトランザクション変更を書き込むために費やした時間(P95、P99、およびP999)
  • MySQLシンクの競合検出期間:MySQLシンクの競合の検出に費やされた時間のヒストグラム
  • MySQLシンク競合検出期間パーセンタイル:1秒以内にMySQLシンク競合を検出するために費やされた時間(P95、P99、およびP999)
  • MySQLシンクワーカーの負荷:TiCDCノードのMySQLシンクワーカーのワークロード

イベント

次に、[イベント]パネルの例を示します。

TiCDC Dashboard - Events metrics 2 TiCDC Dashboard - Events metrics 2 TiCDC Dashboard - Events metrics 2

[イベント]パネルの各メトリックの説明は次のとおりです。

  • イベントフィード数:TiCDCノードのイベントフィードRPCリクエストの数
  • イベントサイズパーセンタイル:TiCDCが1秒以内にTiKVから受信するイベントサイズ(P95、P99、およびP999)
  • イベントフィードエラー/m:1分あたりのTiCDCノードのイベントフィードRPC要求によって報告されたエラーの数
  • KVクライアント受信イベント/秒:TiCDCノードのKVクライアントモジュールがTiKVから1秒あたりに受信するイベントの数
  • プーラー受信イベント/秒:TiCDCノードのプーラーモジュールがKVクライアントから1秒あたりに受信するイベントの数
  • プーラー出力イベント/秒:TiCDCノードのプーラーモジュールが1秒あたりにソーターモジュールに送信するイベントの数
  • シンクフラッシュ行/秒:TiCDCノードが1秒あたりにダウンストリームに書き込むイベントの数
  • プーラーバッファーサイズ:TiCDCノードがプーラーモジュールにキャッシュするイベントの数
  • エントリソーターのバッファーサイズ:TiCDCノードがソーターモジュールにキャッシュするイベントの数
  • プロセッサ/マウンタのバッファサイズ:TiCDCノードがプロセッサモジュールとマウンタモジュールにキャッシュするイベントの数
  • シンク行のバッファサイズ:TiCDCノードがシンクモジュールにキャッシュするイベントの数
  • エントリソーターの並べ替え期間:TiCDCノードがイベントを並べ替えるのに費やした時間のヒストグラム
  • エントリソーターの並べ替え期間のパーセンタイル:1秒以内にTiCDCの並べ替えイベントに費やされた時間(P95、P99、およびP999)
  • エントリソーターのマージ期間:ソートされたイベントをマージするTiCDCノードによって費やされた時間のヒストグラム
  • エントリソーターのマージ期間パーセンタイル:TiCDCが1秒以内にソートされたイベントをマージするために費やした時間(P95、P99、およびP999)
  • マウンターのアンマーシャリング期間:イベントのマーシャリング解除にTiCDCノードが費やした時間のヒストグラム
  • マウンターアンマーシャリング期間パーセンタイル:1秒以内にTiCDCアンマーシャリングイベントによって費やされた時間(P95、P99、およびP999)
  • KVクライアントディスパッチイベント/秒:KVクライアントモジュールがTiCDCノード間でディスパッチするイベントの数
  • KVクライアントのバッチ解決サイズ:TiKVがTiCDCに送信する解決済みタイムスタンプメッセージのバッチサイズ

TiKV

以下は、 TiKVパネルの例です。

TiCDC Dashboard - TiKV metrics 1 TiCDC Dashboard - TiKV metrics 2

TiKVパネルの各メトリックの説明は次のとおりです。

  • CDCエンドポイントCPU:TiKVノードでのCDCエンドポイントスレッドのCPU使用率
  • CDCワーカーCPU:TiKVノードでのCDCワーカースレッドのCPU使用率
  • 最小解決済みts:TiKVノードで最小解決済みタイムスタンプ
  • 最小解決済みリージョン:TiKVノードで最小解決済みタイムスタンプのリージョンID
  • 解決されたtsラグ期間パーセンタイル:TiKVノードで解決された最小タイムスタンプと現在の時刻との間のラグ
  • 初期スキャン期間:TiKVノードがTiCDCノードに接続するときに増分スキャンに費やされた時間のヒストグラム
  • 初期スキャン期間パーセンタイル:1秒以内にTiKVノードのインクリメンタルスキャンに費やされた時間(P95、P99、およびP999)
  • ブロックキャッシュなしのメモリ:RocksDBブロックキャッシュを除くTiKVノードのメモリ使用量
  • メモリ内のCDC保留バイト:TiKVノードでのCDCモジュールのメモリ使用量
  • キャプチャされた領域数:TiKVノード上のイベントキャプチャ領域の数