より多くの列を持つ下流の TiDB テーブルにデータを移行する
このドキュメントでは、対応するアップストリーム テーブルよりも多くの列を持つダウンストリーム TiDB テーブルにデータを移行するときに実行する追加の手順について説明します。通常の移行手順については、次の移行シナリオを参照してください。
- 小規模データセットを MySQL から TiDB に移行する
 - 大規模なデータセットをMySQLからTiDBに移行する
 - 小さなデータセットの MySQL シャードを TiDB に移行してマージする
 - 大規模データセットの MySQL シャードを TiDB に移行してマージする
 
DMを使用して、より多くの列を持つ下流のTiDBテーブルにデータを移行します。
アップストリームbinlogを複製する場合、DM はダウンストリームの現在のテーブル スキーマを使用してbinlogを解析し、対応する DML ステートメントを生成しようとします。アップストリームbinlogのテーブルの列番号がダウンストリーム テーブル スキーマの列番号と一致しない場合は、次のエラーが発生します。
"errors": [
    {
        "ErrCode": 36027,
        "ErrClass": "sync-unit",
        "ErrScope": "internal",
        "ErrLevel": "high",
        "Message": "startLocation: [position: (mysql-bin.000001, 2022), gtid-set:09bec856-ba95-11ea-850a-58f2b4af5188:1-9 ], endLocation: [ position: (mysql-bin.000001, 2022), gtid-set: 09bec856-ba95-11ea-850a-58f2b4af5188:1-9]: gen insert sqls failed, schema: log, table: messages: Column count doesn't match value count: 3 (columns) vs 2 (values)",
        "RawCause": "",
        "Workaround": ""
    }
]
以下はアップストリーム テーブル スキーマの例です。
# Upstream table schema
CREATE TABLE `messages` (
  `id` int(11) NOT NULL,
  PRIMARY KEY (`id`)
)
ダウンストリーム テーブル スキーマの例を次に示します。
# Downstream table schema
CREATE TABLE `messages` (
  `id` int(11) NOT NULL,
  `message` varchar(255) DEFAULT NULL, # This is the additional column that only exists in the downstream table.
  PRIMARY KEY (`id`)
)
DM がダウンストリーム テーブル スキーマを使用してアップストリームによって生成されたbinlogイベントを解析しようとすると、DM は上記のColumn count doesn't matchエラーを報告します。
このような場合、 binlog-schemaコマンドを使用して、データ ソースから移行するテーブルのテーブル スキーマを設定できます。指定されたテーブル スキーマは、DM によって複製されるbinlogイベント データに対応している必要があります。シャード化されたテーブルを移行する場合は、シャード化されたテーブルごとに、DM でテーブル スキーマを設定して、 binlogイベント データを解析する必要があります。手順は次のとおりです。
DM で SQL ファイルを作成し、上流のテーブル スキーマに対応する
CREATE TABLEステートメントをファイルに追加します。たとえば、次のテーブル スキーマをlog.messages.sqlに保存します。DM v6.0 以降のバージョンでは、SQL ファイルを作成せずに--from-sourceまたは--from-targetフラグを追加することでテーブル スキーマを更新できます。詳細については、 移行するテーブルのテーブルスキーマを管理するを参照してください。# Upstream table schema CREATE TABLE `messages` ( `id` int(11) NOT NULL, PRIMARY KEY (`id`) )binlog-schemaコマンドを使用して、データ ソースから移行するテーブルのテーブル スキーマを設定します。この時点で、データ移行タスクは、上記Column count doesn't matchのエラーにより一時停止状態になっているはずです。tiup dmctl --master-addr ${advertise-addr} binlog-schema update -s ${source-id} ${task-name} ${database-name} ${table-name} ${schema-file}このコマンドのパラメータの説明は次のとおりです。
パラメータ 説明 -master-addrdmctl が接続されるクラスター内の任意の DM マスター ノードの ${advertise-addr}を指定します。3${advertise-addr}、DM マスターが外部にアドバタイズするアドレスを示します。binlog-schema setスキーマ情報を手動で設定します。 -sソースを指定します。1 ${source-id}MySQL データのソース ID を示します。${task-name}データ移行タスクの task.yaml構成ファイルで定義されている移行タスクの名前を指定します。${database-name}データベースを指定します。1 ${database-name}アップストリーム データベースの名前を示します。${table-name}アップストリーム テーブルの名前を指定します。 ${schema-file}設定するテーブル スキーマ ファイルを指定します。 例えば:
tiup dmctl --master-addr 172.16.10.71:8261 binlog-schema update -s mysql-01 task-test -d log -t message log.message.sql一時停止状態の移行タスクを再開するには、
resume-taskコマンドを使用します。tiup dmctl --master-addr ${advertise-addr} resume-task ${task-name}query-statusコマンドを使用して、データ移行タスクが正しく実行されていることを確認します。tiup dmctl --master-addr ${advertise-addr} query-status ${task-name}