TiDB データ移行を使用して移行するテーブルのテーブル スキーマを管理する
このドキュメントでは、 dmctl使用して移行中に DM でテーブルのスキーマを管理する方法について説明します。
DM が増分レプリケーションを実行する場合、最初にアップストリームのbinlogを読み取り、次に SQL ステートメントを作成してダウンストリームで実行します。ただし、アップストリームのbinlogには完全なテーブル スキーマが含まれていません。 SQL ステートメントを生成するために、DM は移行されるテーブルのスキーマ情報を内部的に維持します。これは内部テーブル スキーマと呼ばれます。
特別な場合に対処したり、テーブル スキーマの不一致による移行の中断に対処したりするために、DM には内部テーブル スキーマを取得、変更、削除するbinlog-schema
コマンドが用意されています。
実装原則
内部テーブル スキーマは次のソースから取得されます。
- 完全なデータ移行 (
task-mode=all
) の場合、移行タスクはダンプ/ロード/同期という 3 つの段階を経ます。これは、完全なエクスポート、完全なインポート、および増分レプリケーションを意味します。ダンプ段階では、DM はテーブル スキーマ情報をデータとともにエクスポートし、対応するテーブルをダウンストリームに自動的に作成します。同期ステージでは、このテーブル スキーマが増分レプリケーションの開始テーブル スキーマとして使用されます。 - 同期ステージでは、DM が
ALTER TABLE
などの DDL ステートメントを処理するときに、同時に内部テーブル スキーマを更新します。 - タスクが増分移行 (
task-mode=incremental
) であり、ダウンストリームが移行対象のテーブルの作成を完了している場合、DM はダウンストリーム データベースからテーブル スキーマ情報を取得します。この動作は DM のバージョンによって異なります。
増分レプリケーションの場合、スキーマのメンテナンスは複雑です。データ レプリケーション全体では、次の 4 つのテーブル スキーマが関係します。これらのスキーマは、相互に一貫性がある場合もあれば、矛盾している場合もあります。
- 現時点での上流テーブル スキーマ。
schema-U
として識別されます。 - 現在 DM によって消費されているbinlogイベントのテーブル スキーマ。
schema-B
として識別されます。このスキーマは、歴史的な時点の上流テーブル スキーマに対応します。 - DM (スキーマ トラッカーコンポーネント) で現在維持されているテーブル スキーマ。
schema-I
として識別されます。 - ダウンストリーム TiDB クラスター内のテーブル スキーマ。
schema-D
として識別されます。
ほとんどの場合、前述の 4 つのテーブル スキーマは一貫しています。
アップストリーム データベースが DDL 操作を実行してテーブル スキーマを変更すると、 schema-U
が変更されます。 DDL 操作を内部スキーマ トラッカーコンポーネントとダウンストリーム TiDB クラスターに適用することにより、DM はschema-I
とschema-D
を順序立てて更新し、 schema-U
との一貫性を保ちます。したがって、DM は通常、 schema-B
テーブル スキーマに対応するbinlogイベントを消費できます。つまり、DDL 操作が正常に移行された後も、 schema-U
、 schema-B
、 schema-I
、およびschema-D
は一貫性を保ちます。
不整合が発生する可能性がある次の状況に注意してください。
楽観的モード シャーディング DDL サポートを有効にして移行すると、ダウンストリーム テーブルの
schema-D
、一部のアップストリーム シャード テーブルのschema-B
およびschema-I
と矛盾する可能性があります。このような場合でも、DM はschema-I
とschema-B
の一貫性を維持し、DML に対応するbinlogイベントを正常に解析できるようにします。下流テーブルに上流テーブルよりも多くの列がある場合、
schema-D
schema-B
およびschema-I
と矛盾する可能性があります。完全なデータ移行 (task-mode=all
) では、DM が不整合を自動的に処理します。増分移行 (task-mode=incremental
) では、タスクが初めて開始され、内部スキーマ情報がまだないため、DM は自動的にダウンストリーム スキーマ (schema-D
) を読み取り、スキーマschema-I
更新します (この動作は DM のバージョンによって異なります)。その後、DM がschema-I
使用してschema-B
のbinlogを解析すると、Column count doesn't match value count
エラーが報告されます。詳細はより多くの列を含むダウンストリーム TiDB テーブルにデータを移行するを参照してください。
binlog-schema
コマンドを実行して、DM で保持されているschema-I
テーブル スキーマを取得、変更、または削除できます。
ノート:
binlog-schema
コマンドは、DM v6.0 以降のバージョンでのみサポートされます。以前のバージョンの場合は、operate-schema
コマンドを使用する必要があります。
指図
help binlog-schema
manage or show table schema in schema tracker
Usage:
dmctl binlog-schema [command]
Available Commands:
delete delete table schema structure
list show table schema structure
update update tables schema structure
Flags:
-h, --help help for binlog-schema
Global Flags:
-s, --source strings MySQL Source ID.
Use "dmctl binlog-schema [command] --help" for more information about a command.
ノート:
- データ移行中にテーブル スキーマが変更される可能性があるため、予測可能なテーブル スキーマを取得するには、現在、データ移行タスクが
Paused
状態にある場合にのみbinlog-schema
コマンドを使用できます。- 誤った処理によるデータの損失を避けるために、スキーマを変更する前に、まずテーブル スキーマを取得してバックアップすることを強くお勧めします。
パラメーター
delete
: テーブルスキーマを削除します。list
: テーブルスキーマをリストします。update
: テーブルスキーマを更新します。-s
または--source
:- 必要。
- 操作が適用される MySQL ソースを指定します。
使用例
テーブルスキーマを取得する
テーブル スキーマを取得するには、 binlog-schema list
コマンドを実行します。
help binlog-schema list
show table schema structure
Usage:
dmctl binlog-schema list <task-name> <database> <table> [flags]
Flags:
-h, --help help for list
Global Flags:
-s, --source strings MySQL Source ID.
db_single
タスクのmysql-replica-01
MySQL ソースに対応する`db_single`.`t1`
テーブルのテーブル スキーマを取得する場合は、次のコマンドを実行します。
binlog-schema list -s mysql-replica-01 task_single db_single t1
{
"result": true,
"msg": "",
"sources": [
{
"result": true,
"msg": "CREATE TABLE `t1` ( `c1` int(11) NOT NULL, `c2` int(11) DEFAULT NULL, PRIMARY KEY (`c1`)) ENGINE=InnoDB DEFAULT CHARSET=latin1 COLLATE=latin1_bin",
"source": "mysql-replica-01",
"worker": "127.0.0.1:8262"
}
]
}
テーブルスキーマを更新する
テーブル スキーマを更新するには、 binlog-schema update
コマンドを実行します。
help binlog-schema update
update tables schema structure
Usage:
dmctl binlog-schema update <task-name> <database> <table> [schema-file] [flags]
Flags:
--flush flush the table info and checkpoint immediately (default true)
--from-source use the schema from upstream database as the schema of the specified tables
--from-target use the schema from downstream database as the schema of the specified tables
-h, --help help for update
--sync sync the table info to master to resolve shard ddl lock, only for optimistic mode now (default true)
Global Flags:
-s, --source strings MySQL Source ID.
db_single
タスクでmysql-replica-01
MySQLソースに対応する`db_single`.`t1`
テーブルのテーブルスキーマを設定したい場合は以下のようになります。
CREATE TABLE `t1` (
`c1` int(11) NOT NULL,
`c2` bigint(11) DEFAULT NULL,
PRIMARY KEY (`c1`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1 COLLATE=latin1_bin
上記のCREATE TABLE
ステートメントをファイル (例: db_single.t1-schema.sql
) として保存し、次のコマンドを実行します。
operate-schema set -s mysql-replica-01 task_single -d db_single -t t1 db_single.t1-schema.sql
{
"result": true,
"msg": "",
"sources": [
{
"result": true,
"msg": "",
"source": "mysql-replica-01",
"worker": "127.0.0.1:8262"
}
]
}
テーブルスキーマを削除する
テーブル スキーマを削除するには、 binlog-schema delete
コマンドを実行します。
help binlog-schema delete
delete table schema structure
Usage:
dmctl binlog-schema delete <task-name> <database> <table> [flags]
Flags:
-h, --help help for delete
Global Flags:
-s, --source strings MySQL Source ID.
ノート:
DM で維持されているテーブル スキーマが削除された後、このテーブルに関連する DDL/DML ステートメントをダウンストリームに移行する必要がある場合、DM は次の 3 つのソースからテーブル スキーマを順序どおりに取得しようとします。
- チェックポイント テーブルの
table_info
フィールド- 楽観的シャーディング DDL のメタ情報
- ダウンストリーム TiDB の対応するテーブル
db_single
タスクのmysql-replica-01
MySQL ソースに対応する`db_single`.`t1`
テーブルのテーブル スキーマを削除する場合は、次のコマンドを実行します。
binlog-schema delete -s mysql-replica-01 task_single db_single t1
{
"result": true,
"msg": "",
"sources": [
{
"result": true,
"msg": "",
"source": "mysql-replica-01",
"worker": "127.0.0.1:8262"
}
]
}