TiDB クラスター間の双方向レプリケーション

警告

現在、双方向レプリケーションはまだ実験的機能です。本番環境での使用は推奨されません。
TiDB Binlog はTiDB v5.0 で導入された一部の機能と互換性がなく、併用できません。詳細についてはノートを参照してください。
TiDB v7.5.0 以降、TiDB Binlogのデータレプリケーション機能のテクニカルサポートは提供されなくなりました。データレプリケーションの代替ソリューションとしてティCDCを使用することを強くお勧めします。
TiDB v7.5.0 では、TiDB Binlogのリアルタイムバックアップと復元機能が引き続きサポートされていますが、このコンポーネントは将来のバージョンでは完全に廃止される予定です。データ復旧の代替ソリューションとしてピトルを使用することをお勧めします。

このドキュメントでは、2 つの TiDB クラスター間の双方向レプリケーション、レプリケーションの仕組み、有効化の方法、および DDL 操作をレプリケートする方法について説明します。

ユーザーシナリオ

2 つの TiDB クラスターが相互にデータの変更を交換する場合は、TiDB Binlog を使用するとそれが可能になります。たとえば、クラスター A とクラスター B が相互にデータを複製するとします。

注記：
これら 2 つのクラスターに書き込まれるデータは競合がないことが必要です。つまり、2 つのクラスターで、同じ主キーまたはテーブルの一意のインデックスを持つ行を変更してはなりません。

ユーザーシナリオは以下のようになります。

Architect

実装の詳細

Mark Table

クラスター A とクラスター B の間で双方向レプリケーションが有効になっている場合、クラスター A に書き込まれたデータはクラスター B にレプリケートされ、その後これらのデータ変更がクラスター A にレプリケートされ、レプリケーションの無限ループが発生します。上の図から、データレプリケーション中にDrainer がbinlogイベントをマークし、マークされたイベントをフィルターしてこのようなレプリケーションループを回避することがわかります。

詳細な実装は次のように説明されます。

2 つのクラスターそれぞれに対して TiDB Binlogレプリケーションプログラムを起動します。
複製されるトランザクションがクラスター A のDrainerを通過すると、このDrainer はトランザクションに_drainer_repl_markテーブルを追加し、この DML イベント更新をマークテーブルに書き込み、このトランザクションをクラスター B に複製します。
クラスタB は、マークテーブル_drainer_repl_markを含むbinlogイベントをクラスター A に返します。クラスター B のDrainer は、 binlogイベントを解析するときに DML イベントを含むマークテーブルを識別し、このbinlogイベントをクラスター A に複製することを中止します。

クラスター B からクラスター A へのレプリケーションプロセスは上記と同じです。2 つのクラスターは、互いに上流と下流に存在できます。

注記：
_drainer_repl_markマークテーブルを更新する場合、バイナリログを生成するためにデータの変更が必要になります。
DDL 操作はトランザクションではないため、DDL 操作をレプリケートするには一方向レプリケーション方式を使用する必要があります。詳細についてはDDL操作を複製する参照してください。

Drainerは、競合を避けるために、ダウンストリームへの接続ごとに一意の ID を使用できます。1 channel_id双方向レプリケーションのチャネルを示すために使用されます。2 つのクラスターは同じchannel_id構成 (同じ値) を持つ必要があります。

アップストリームで列を追加または削除すると、ダウンストリームに複製されるデータの列が余分に存在したり、不足したりする可能性があります。Drainerは、余分な列を無視するか、不足している列にデフォルト値を挿入することで、この状況に対応します。

マークテーブル

_drainer_repl_markマークテーブルの構造は次のとおりです。

CREATE TABLE `_drainer_repl_mark` (
  `id` bigint(20) NOT NULL,
  `channel_id` bigint(20) NOT NULL DEFAULT '0',
  `val` bigint(20) DEFAULT '0',
  `channel_info` varchar(64) DEFAULT NULL,
  PRIMARY KEY (`id`,`channel_id`)
);

Drainer は次の SQL ステートメントを使用して_drainer_repl_mark更新し、データの変更とbinlogの生成を保証します。

update drainer_repl_mark set val = val + 1 where id = ? && channel_id = ?;

DDL操作を複製する

Drainer はDDL 操作にマークテーブルを追加できないため、DDL 操作をレプリケートするには一方向のレプリケーションメソッドのみを使用できます。

たとえば、クラスター A からクラスター B への DDL レプリケーションが有効になっている場合、クラスター B からクラスター A へのレプリケーションは無効になります。つまり、すべての DDL 操作はクラスター A で実行されます。

注記：
DDL 操作は、2 つのクラスターで同時に実行できません。DDL 操作の実行時に、DML 操作が同時に実行されていたり、DMLbinlogがレプリケートされていたりすると、DML レプリケーションの上流と下流のテーブル構造に不整合が生じる可能性があります。

双方向レプリケーションを構成して有効にする

クラスター A とクラスター B 間の双方向レプリケーションでは、すべての DDL 操作がクラスター A で実行されると想定します。クラスター A からクラスター B へのレプリケーションパスで、 Drainerに次の構成を追加します。

[syncer]
loopback-control = true
channel-id = 1 # Configures the same ID for both clusters to be replicated.
sync-ddl = true # Enables it if you need to perform DDL replication.

[syncer.to]
# 1 means SyncFullColumn and 2 means SyncPartialColumn.
# If set to SyncPartialColumn, Drainer allows the downstream table
# structure to have more or fewer columns than the data to be replicated
# And remove the STRICT_TRANS_TABLES of the SQL mode to allow fewer columns, and insert zero values to the downstream.
sync-mode = 2

# Ignores the checkpoint table.
[[syncer.ignore-table]]
db-name = "tidb_binlog"
tbl-name = "checkpoint"

クラスター B からクラスター A へのレプリケーションパスで、 Drainerに次の構成を追加します。

[syncer]
loopback-control = true
channel-id = 1 # Configures the same ID for both clusters to be replicated.
sync-ddl = false  # Disables it if you do not need to perform DDL replication.

[syncer.to]
# 1 means SyncFullColumn and 2 means SyncPartialColumn.
# If set to SyncPartialColumn, Drainer allows the downstream table
# structure to have more or fewer columns than the data to be replicated
# And remove the STRICT_TRANS_TABLES of the SQL mode to allow fewer columns, and insert zero values to the downstream.
sync-mode = 2

# Ignores the checkpoint table.
[[syncer.ignore-table]]
db-name = "tidb_binlog"
tbl-name = "checkpoint"