TiCDC の新しいアーキテクチャ

TiCDC は、 TiCDC v8.5.4-リリース.1から、リアルタイムデータレプリケーションのパフォーマンス、スケーラビリティ、安定性を向上させながら、リソースコストを削減する新しいアーキテクチャを導入します。この新しいアーキテクチャは、TiCDC のコアコンポーネントを再設計し、データ処理ワークフローを最適化することで、以下の利点をもたらします。

単一ノードのパフォーマンスの向上: 単一ノードで最大 500,000 個のテーブルを複製でき、ワイドテーブルシナリオでは単一ノードで最大 190 MiB/秒のレプリケーションスループットを実現します。
拡張性の向上：クラスタレプリケーション機能はほぼ直線的に拡張可能です。単一のクラスタで100ノード以上に拡張でき、10,000以上の変更フィードをサポートし、単一の変更フィード内で数百万のテーブルをレプリケートできます。
安定性の向上：高トラフィック、頻繁なDDL操作、クラスターのスケーリングイベントが発生するシナリオにおいて、チェンジフィードのレイテンシーが短縮され、パフォーマンスがより安定します。リソースの分離と優先スケジューリングにより、複数のチェンジフィードタスク間の干渉が軽減されます。
リソースコストの削減: リソース使用率の向上と冗長性の削減により、一般的なシナリオでは CPU とメモリのリソース使用量を最大 50% 削減できます。

建築設計

TiCDC New Architecture

TiCDC の新しいアーキテクチャは、ログサービスとダウンストリームアダプターの 2 つのコアコンポーネントで構成されます。

ログサービス：コアデータサービスレイヤーとして、ログサービスは上流TiDBクラスタから行変更やDDLイベントなどの情報を取得し、変更データをローカルディスクに一時的に保存します。また、下流アダプタからのデータ要求に応答し、DMLデータとDDLデータを定期的にマージおよびソートし、ソート済みのデータを下流アダプタにプッシュします。
ダウンストリームアダプタ：ダウンストリームデータレプリケーション適応レイヤーとして、ダウンストリームアダプタはユーザーが開始した変更フィード操作を処理します。関連するレプリケーションタスクをスケジュールおよび生成し、ログサービスからデータを取得し、取得したデータをダウンストリームシステムに複製します。

TiCDCの新しいアーキテクチャは、アーキテクチャをステートフルコンポーネントとステートレスコンポーネントに分離することで、システムのスケーラビリティ、信頼性、柔軟性を大幅に向上させます。ステートフルコンポーネントであるログサービスは、データの取得、ソート、storageに重点を置いています。ログサービスをチェンジフィード処理ロジックから分離することで、複数のチェンジフィード間でのデータ共有が可能になり、リソース使用率を効果的に向上させ、システムオーバーヘッドを削減します。ステートレスコンポーネントであるダウンストリームアダプタは、軽量なスケジューリングメカニズムを使用して、インスタンス間でのレプリケーションタスクの迅速な移行を可能にします。ワークロードの変化に基づいてレプリケーションタスクの分割とマージを動的に調整できるため、さまざまなシナリオで低レイテンシのレプリケーションを実現します。

古典的なアーキテクチャと新しいアーキテクチャの比較

新しいアーキテクチャは、パフォーマンスのボトルネック、不十分な安定性、スケーラビリティの限界など、システムの継続的なスケーリング時に発生する一般的な問題に対処するように設計されています古典アーキテクチャと比較して、新しいアーキテクチャは以下の主要な側面において大幅な最適化を実現しています。

特徴	TiCDC クラシックアーキテクチャ	TiCDCの新しいアーキテクチャ
処理ロジックドライバー	タイマー駆動	イベント駆動型
タスクトリガーメカニズム	50 ミリ秒ごとにタスクをチェックするタイマートリガーのメインループ。処理パフォーマンスは限られています。	イベントドリブン型。DML変更、DDL変更、チェンジフィード操作などのイベントによってトリガーされます。キュー内のイベントは、固定の50ミリ秒間隔を待たずに可能な限り迅速に処理されるため、追加のレイテンシーが削減されます。
タスクスケジューリング方法	各チェンジフィードはタスクをポーリングするメインループを実行します	イベントはキューに入れられ、複数のスレッドによって同時に処理されます
タスク処理効率	各タスクは複数のサイクルを経るため、パフォーマンスのボトルネックが発生します。	イベントは一定間隔を待たずに即座に処理され、レイテンシーが短縮されます。
資源消費	非アクティブなテーブルを頻繁にチェックするとCPUリソースが浪費される	消費者スレッドはキューに入れられたイベントのみを処理し、非アクティブなタスクのチェックの消費を回避します。
複雑	O(n)、テーブル数が増えるとパフォーマンスは低下する	O(1)、テーブル数の影響を受けず、効率が向上
CPU使用率	各変更フィードは1つの論理CPUのみを使用できます	各チェンジフィードは、マルチコアCPUの並列処理能力を最大限に活用できます。
スケーラビリティ	スケーラビリティが低い（CPUの数によって制限される）	マルチスレッド処理とイベントキューによる強力なスケーラビリティ
チェンジフィード干渉	オーナーノードはチェンジフィード間の干渉を引き起こす可能性がある	イベント駆動モードはチェンジフィード間の干渉を回避します

Comparison between the TiCDC classic and new architectures

クラシックアーキテクチャと新しいアーキテクチャから選択

ワークロードが次のいずれかの条件を満たす場合は、パフォーマンスと安定性を向上させるために、アーキテクチャ古典的なTiCDCアーキテクチャから新しいアーキテクチャに切り替えることをお勧めします。

増分スキャンパフォーマンスのボトルネック: 増分スキャンタスクの完了に非常に長い時間がかかり、レプリケーションのレイテンシーが継続的に増加します。
超高トラフィックシナリオ: 合計変更フィードトラフィックが 700 MiB/s を超えます。
MySQL シンクでの高スループット書き込みを備えた単一テーブル: ターゲットテーブルには主キーまたは null 以外の一意のキーが 1 つだけあります。
大規模なテーブルレプリケーション: 複製するテーブルの数が 100,000 を超えます。
頻繁な DDL 操作によるレイテンシーの発生: DDL ステートメントを頻繁に実行すると、レプリケーションのレイテンシーが大幅に増加します。

新機能

新しいアーキテクチャは、 MySQLシンクのテーブルレベルのタスク分割をサポートします。この機能を有効にするには、changefeed設定でscheduler.enable-table-across-nodes = true設定します。

この機能を有効にすると、TiCDCは、以下のいずれかの条件を満たすテーブルを、主キーが1つだけ、またはNULL以外の一意キーを持つテーブルに自動的に分割し、複数のノードに分散して並列レプリケーションを実行します。これにより、レプリケーションの効率とリソース利用率が向上します。

テーブルのリージョン数が設定されたしきい値 (デフォルトでは100000ですが、 scheduler.region-thresholdで調整可能) を超えています。
テーブル書き込みトラフィックが設定されたしきい値を超えています (デフォルトでは無効、 scheduler.write-key-thresholdで設定可能)。

互換性

DDL 進捗追跡テーブル

TiCDCの従来のアーキテクチャでは、DDLレプリケーション操作は厳密にシリアル化されているため、レプリケーションの進行状況は変更フィードのCheckpointTs使用してのみ追跡できます。しかし、新しいアーキテクチャでは、TiCDCは可能な限り異なるテーブルのDDL変更を並列にレプリケートすることで、DDLレプリケーションの効率を向上させます。下流のMySQL互換データベースの各テーブルのDDLレプリケーションの進行状況を正確に記録するために、TiCDCの新しいアーキテクチャは下流データベースにtidb_cdc.ddl_ts_v1名前のテーブルを作成し、変更フィードのDDLレプリケーションの進行状況情報を具体的に保存します。

DDLレプリケーション動作の変更

従来のTiCDCアーキテクチャでは、テーブル名を入れ替えるDDL（例： RENAME TABLE a TO c, b TO a, c TO b; ）はサポートされていません。新しいアーキテクチャでは、このようなDDLがサポートされています。
新しいアーキテクチャでは、 RENAME DDL のフィルタリングルールが統合され、簡素化されます。
- クラシックアーキテクチャでは、フィルタリングロジックは次のようになります。
  - 単一テーブルの名前変更: 古いテーブル名がフィルタールールと一致する場合にのみ、DDL ステートメントが複製されます。
  - 複数テーブルの名前変更: 古いテーブル名と新しいテーブル名の両方がフィルタールールに一致する場合にのみ、DDL ステートメントが複製されます。
- 新しいアーキテクチャでは、単一テーブルと複数テーブルの両方の名前変更において、ステートメント内の古いテーブル名がフィルタールールと一致する限り、DDL ステートメントが複製されます。
  次のフィルタルールを例に挙げます。
```
[filter]
rules = ['test.t*']
```
  - クラシックアーキテクチャの場合： RENAME TABLE test.t1 TO ignore.t1のような単一テーブルの名前変更では、古いテーブル名test.t1ルールに一致するため、レプリケートされます。5 RENAME TABLE test.t1 TO ignore.t1, test.t2 TO test.t22;ような複数テーブルの名前変更では、新しいテーブル名ignore.t1がルールに一致しないため、レプリケートされません。
  - 新しい TiCDCアーキテクチャでは、 RENAME TABLE test.t1 TO ignore.t1とRENAME TABLE test.t1 TO ignore.t1, test.t2 TO test.t22;両方の古いテーブル名がルールに一致するため、両方の DDL ステートメントが複製されます。

制限事項

新しいTiCDCアーキテクチャには、従来のアーキテクチャのすべての機能が組み込まれています。ただし、一部の機能はまだ完全にテストされていません。システムの安定性を確保するため、以下の機能はコア本番環境での使用は推奨されません。

さらに、新しいTiCDCアーキテクチャは現在、ダウンストリームレプリケーションのために大規模なトランザクションを複数のバッチに分割することをサポートしていません。そのため、非常に大規模なトランザクションを処理する際には、依然としてOOMのリスクが存在します。新しいアーキテクチャを使用する前に、このリスクを適切に評価し、軽減するようにしてください。

アップグレードガイド

TiCDCの新しいアーキテクチャは、TiDBクラスタのバージョン7.5.0以降にのみ導入できます。導入前に、TiDBクラスタがこのバージョン要件を満たしていることを確認してください。

TiUPまたはTiDB Operatorを使用して、TiCDC の新しいアーキテクチャをデプロイできます。

TiUPを使用して TiCDC の新しいアーキテクチャを展開するには、次の手順を実行します。

TiDBクラスターにまだTiCDCノードが存在しない場合は、 TiCDC クラスターをスケールアウトするを参照してクラスターに新しいTiCDCノードを追加してください。そうでない場合は、この手順をスキップしてください。
新しいアーキテクチャ用の TiCDC バイナリパッケージをダウンロードします。
ダウンロードリンクの形式はhttps://tiup-mirrors.pingcap.com/cdc-${version}-${os}-${arch}.tar.gz 、 ${version}は TiCDC のバージョン、 ${os}はオペレーティングシステム、 ${arch}コンポーネントが実行されるプラットフォーム ( amd64またはarm64 ) です。
たとえば、Linux (x86-64) 用の TiCDC v8.5.4-release.1 のバイナリパッケージをダウンロードするには、次のコマンドを実行します。
```
wget https://tiup-mirrors.pingcap.com/cdc-v8.5.4-release.1-linux-amd64.tar.gz
```
TiDB クラスターで変更フィードが実行中の場合は、レプリケーションタスクを一時停止するを参照して、変更フィードのすべてのレプリケーションタスクを一時停止します。
```
# The default server port of TiCDC is 8300.
cdc cli changefeed pause --server=http://<ticdc-host>:8300 --changefeed-id <changefeed-name>
```
tiup cluster patchコマンドを使用して、ダウンロードした TiCDC バイナリファイルを TiDB クラスターにパッチ適用します。
```
tiup cluster patch <cluster-name> ./cdc-v8.5.4-release.1-linux-amd64.tar.gz -R cdc
```
新しいアーキテクチャを有効にするには、 tiup cluster edit-configコマンドを使用して TiCDC 構成を更新します。
```
tiup cluster edit-config <cluster-name>
```
```
server_configs:
  cdc:
    newarch: true
```
すべてのレプリケーションタスクを再開するには、レプリケーションタスクを再開するを参照してください。
```
# The default server port of TiCDC is 8300.
cdc cli changefeed resume --server=http://<ticdc-host>:8300 --changefeed-id <changefeed-name>
```

TiDB Operatorを使用して TiCDC の新しいアーキテクチャをデプロイするには、次の手順を実行します。

TiDBクラスタにTiCDCコンポーネントが含まれていない場合は、既存の TiDB クラスターに TiCDC を追加するを参照して新しいTiCDCノードを追加してください。その際、クラスタ構成ファイルで新しいアーキテクチャバージョンとしてTiCDCイメージバージョンを指定してください。
例えば：
```
spec:
  ticdc:
    baseImage: pingcap/ticdc
    version: v8.5.4-release.1
    replicas: 3
    config:
      newarch = true
```

TiDB クラスターにすでに TiCDCコンポーネントが含まれている場合は、次の手順を実行します。

TiDB クラスターで変更フィードが実行されている場合は、変更フィードのすべてのレプリケーションタスクを一時停止します。

kubectl exec -it ${pod_name} -n ${namespace} -- sh

# The default server port of TiCDC deployed via TiDB Operator is 8301.
/cdc cli changefeed pause --server=http://127.0.0.1:8301 --changefeed-id <changefeed-name>

クラスター構成ファイル内の TiCDC イメージバージョンを新しいアーキテクチャバージョンに更新します。

kubectl edit tc ${cluster_name} -n ${namespace}

spec:
  ticdc:
    baseImage: pingcap/ticdc
    version: v8.5.4-release.1
    replicas: 3

kubectl apply -f ${cluster_name} -n ${namespace}

すべてのレプリケーションタスクを再開します。

kubectl exec -it ${pod_name} -n ${namespace} -- sh

# The default server port of TiCDC deployed via TiDB Operator is 8301.
/cdc cli changefeed resume --server=http://127.0.0.1:8301 --changefeed-id <changefeed-name>

新しいアーキテクチャを使用する

新しいアーキテクチャでTiCDCノードをデプロイした後も、クラシックアーキテクチャと同じコマンドを引き続き使用できます。新しいコマンドを学習したり、クラシックアーキテクチャで使用されていたコマンドを変更したりする必要はありません。

たとえば、新しいアーキテクチャのTiCDC ノードにレプリケーションタスクを作成するには、次のコマンドを実行します。

cdc cli changefeed create --server=http://127.0.0.1:8300 --sink-uri="mysql://root:123456@127.0.0.1:3306/" --changefeed-id="simple-replication-task"

特定のレプリケーションタスクの詳細を照会するには、次のコマンドを実行します。

cdc cli changefeed query -s --server=http://127.0.0.1:8300 --changefeed-id=simple-replication-task

コマンドの使用方法や詳細については、チェンジフィードを管理する参照してください。

監視

現在、TiCDCの新アーキテクチャの監視ダッシュボード「TiCDC-New-Arch」はTiUPで管理されていません。このダッシュボードをGrafanaで表示するには、 TiCDC 監視メトリックファイル手動でインポートする必要があります。

各監視メトリックの詳細な説明については、新しいアーキテクチャにおける TiCDC のメトリクス参照してください。