DM でシャーディング DDL ロックを手動で処理する
DM はシャーディング DDL ロックを使用して、操作が正しい順序で実行されることを保証します。このロック メカニズムは、ほとんどの場合、シャーディング DDL ロックを自動的に解決しますが、一部の異常なシナリオでは、 shard-ddl-lock
コマンドを使用して異常な DDL ロックを手動で処理する必要があります。
ノート:
- このドキュメントは、悲観的調整モードでのシャーディング DDL ロックの処理にのみ適用されます。
- このドキュメントの「コマンドの使用法」セクションのコマンドは対話モードです。コマンドライン モードでは、エラー レポートを回避するためにエスケープ文字を追加する必要があります。
- コマンドによってもたらされる可能性のある影響を完全に理解しており、それを受け入れることができる場合を除き、
shard-ddl-lock unlock
を使用しないでください。- 異常な DDL ロックを手動で処理する前に、DM シャードマージの原則を必ず読んでください。
指図
shard-ddl-lock
このコマンドを使用すると、DDL ロックを表示し、指定された DDL ロックを解放するように DM マスターに要求できます。このコマンドは、DM v6.0 以降でのみサポートされます。以前のバージョンの場合は、 show-ddl-locks
およびunlock-ddl-locks
コマンドを使用する必要があります。
shard-ddl-lock -h
maintain or show shard-ddl locks information
Usage:
dmctl shard-ddl-lock [task] [flags]
dmctl shard-ddl-lock [command]
Available Commands:
unlock Unlock un-resolved DDL locks forcely
Flags:
-h, --help help for shard-ddl-lock
Global Flags:
-s, --source strings MySQL Source ID.
Use "dmctl shard-ddl-lock [command] --help" for more information about a command.
引数の説明
shard-ddl-lock [task] [flags]
: 現在の DM マスターの DDL ロック情報を表示します。
shard-ddl-lock [command]
: 指定された DDL ロックを解放するように DM マスターに要求します。[command]
値としてunlock
のみを受け入れます。
使用例
shard-ddl-lock [task][flags]
shard-ddl-lock [task] [flags]
を使用すると、現在の DM マスターの DDL ロック情報を表示できます。例えば:
shard-ddl-lock test
期待される出力
{
"result": true, # The result of the query for the lock information.
"msg": "", # The additional message for the failure to query the lock information or other descriptive information (for example, the lock task does not exist).
"locks": [ # The existing lock information list.
{
"ID": "test-`shard_db`.`shard_table`", # The lock ID, which is made up of the current task name and the schema/table information corresponding to the DDL.
"task": "test", # The name of the task to which the lock belongs.
"mode": "pessimistic" # The shard DDL mode. Can be set to "pessimistic" or "optimistic".
"owner": "mysql-replica-01", # The owner of the lock (the ID of the first source that encounters this DDL operation in the pessimistic mode), which is always empty in the optimistic mode.
"DDLs": [ # The list of DDL operations corresponding to the lock in the pessimistic mode, which is always empty in the optimistic mode.
"USE `shard_db`; ALTER TABLE `shard_db`.`shard_table` DROP COLUMN `c2`;"
],
"synced": [ # The list of sources that have received all sharding DDL events in the corresponding MySQL instance.
"mysql-replica-01"
],
"unsynced": [ # The list of sources that have not yet received all sharding DDL events in the corresponding MySQL instance.
"mysql-replica-02"
]
}
]
}
shard-ddl-lock unlock
このコマンドは、所有者に DDL ステートメントを実行するよう要求すること、所有者ではない他のすべての DM ワーカーに DDL ステートメントをスキップするよう要求すること、およびDM-master
ロック情報を削除することなど、指定された DDL ロックのロックを解除するためにDM-master
積極的に要求します。
ノート:
現在、
shard-ddl-lock unlock
pessimistic
モードのロックに対してのみ有効です。
shard-ddl-lock unlock -h
Unlock un-resolved DDL locks forcely
Usage:
dmctl shard-ddl-lock unlock <lock-id> [flags]
Flags:
-a, --action string accept skip/exec values which means whether to skip or execute ddls (default "skip")
-d, --database string database name of the table
-f, --force-remove force to remove DDL lock
-h, --help help for unlock
-o, --owner string source to replace the default owner
-t, --table string table name
Global Flags:
-s, --source strings MySQL Source ID.
shard-ddl-lock unlock
次の引数を受け入れます。
-o, --owner
:- 国旗;弦;オプション
- 指定されていない場合、このコマンドはデフォルトの所有者 (
shard-ddl-lock
の結果の所有者) に DDL ステートメントを実行するよう要求します。指定されている場合、このコマンドは MySQL ソース (デフォルト所有者の代替) に DDL ステートメントを実行するよう要求します。 - 元の所有者がすでにクラスターから削除されていない限り、新しい所有者を指定しないでください。
-f, --force-remove
:- 国旗;ブール値;オプション
- 指定されていない場合、このコマンドは、所有者が DDL ステートメントの実行に成功した場合にのみロック情報を削除します。これが指定されている場合、このコマンドは、所有者が DDL ステートメントの実行に失敗した場合でも、ロック情報を強制的に削除します (これを実行した後は、再度ロックをクエリしたり操作したりすることはできません)。
lock-id
:- 非フラグ。弦;必要
- ロックを解除する必要がある DDL ロックの ID (
shard-ddl-lock
の結果のID
) を指定します。
以下はshard-ddl-lock unlock
コマンドの例です。
shard-ddl-lock unlock test-`shard_db`.`shard_table`
{
"result": true, # The result of the unlocking operation.
"msg": "", # The additional message for the failure to unlock the lock.
}
サポートされているシナリオ
現在、 shard-ddl-lock unlock
コマンドは、次の 2 つの異常なシナリオでのシャーディング DDL ロックの処理のみをサポートしています。
シナリオ 1: 一部の MySQL ソースが削除される
異常ロックの原因
DM-master
がシャーディング DDL ロックの自動的なロック解除を試行する前に、すべての MySQL ソースがシャーディング DDL イベントを受信する必要があります (詳細はシャードマージの原則を参照)。シャーディング DDL イベントがすでに移行プロセス中であり、一部の MySQL ソースが削除されて再ロードされない場合 (これらの MySQL ソースはアプリケーションの要求に応じて削除されています)、シャーディング DDL ロックは自動的に移行およびロック解除できません。すべての DM ワーカーが DDL イベントを受信できるわけではないためです。
ノート:
シャーディング DDL イベントの移行プロセス中でないときに一部の DM ワーカーをオフラインにする必要がある場合、より良い解決策は、
stop-task
を使用して実行中のタスクを停止し、DM ワーカーをオフラインにし、対応する構成情報をタスク構成ファイルを作成し、最後にstart-task
と新しいタスク構成を使用して移行タスクを再開します。
手動による解決策
上流に 2 つのインスタンスMySQL-1
( mysql-replica-01
) とMySQL-2
( mysql-replica-02
) があり、2 つのテーブルshard_db_1
があるとします。 shard_table_1
およびshard_db_1
。 MySQL-1
のshard_table_2
と 2 つのテーブルshard_db_2
。 shard_table_1
およびshard_db_2
。 MySQL-2
のshard_table_2
。ここで、4 つのテーブルをマージし、テーブルshard_db
に移行する必要があります。ダウンストリーム TiDB ではshard_table
。
初期のテーブル構造は次のとおりです。
SHOW CREATE TABLE shard_db_1.shard_table_1;
+---------------+------------------------------------------+
| Table | Create Table |
+---------------+------------------------------------------+
| shard_table_1 | CREATE TABLE `shard_table_1` (
`c1` int(11) NOT NULL,
PRIMARY KEY (`c1`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1 |
+---------------+------------------------------------------+
次の DDL 操作が上流のシャード テーブルで実行され、テーブル構造が変更されます。
ALTER TABLE shard_db_*.shard_table_* ADD COLUMN c2 INT;
MySQLとDMの動作プロセスは以下のとおりです。
対応する DDL 操作が
mysql-replica-01
の 2 つのシャード テーブルに対して実行され、テーブル構造が変更されます。ALTER TABLE shard_db_1.shard_table_1 ADD COLUMN c2 INT;ALTER TABLE shard_db_1.shard_table_2 ADD COLUMN c2 INT;DM-worker は受信した
mysql-replica-01
の 2 つのシャード テーブルの DDL 情報を DM-master に送信し、DM-master は対応する DDL ロックを作成します。現在の DDL ロックの情報を確認するには、
shard-ddl-lock
を使用します。» shard-ddl-lock test { "result": true, "msg": "", "locks": [ { "ID": "test-`shard_db`.`shard_table`", "task": "test", "mode": "pessimistic" "owner": "mysql-replica-01", "DDLs": [ "USE `shard_db`; ALTER TABLE `shard_db`.`shard_table` ADD COLUMN `c2` int(11);" ], "synced": [ "mysql-replica-01" ], "unsynced": [ "mysql-replica-02" ] } ] }アプリケーションの要求により、
mysql-replica-02
に対応するデータをダウンストリーム TiDB に移行する必要がなくなり、mysql-replica-02
が削除されます。ID が
test-`shard_db`.`shard_table`
のDM-master
ロックは、mysql-replica-02
の DDL 情報を受け取ることができません。- 返される結果
unsynced
xshard-ddl-lock
には、常にmysql-replica-02
の情報が含まれています。
- 返される結果
shard-ddl-lock unlock
を使用してDM-master
要求し、DDL ロックをアクティブにロック解除します。DDL ロックの所有者がオフラインになった場合は、パラメータ
--owner
を使用して、別の DM ワーカーを新しい所有者として指定し、DDL を実行できます。いずれかの MySQL ソースがエラーを報告すると、
result
false
に設定されます。この時点で、各 MySQL ソースのエラーが許容範囲内であり、想定内であるかどうかを注意深く確認する必要があります。shard-ddl-lock unlock test-`shard_db`.`shard_table`{ "result": true, "msg": ""
DDL ロックが正常にロック解除されたかどうかを確認するには、
shard-ddl-lock
を使用します。» shard-ddl-lock test { "result": true, "msg": "no DDL lock exists", "locks": [ ] }ダウンストリーム TiDB でテーブル構造が正常に変更されたかどうかを確認します。
mysql> SHOW CREATE TABLE shard_db.shard_table; +-------------+--------------------------------------------------+ | Table | Create Table | +-------------+--------------------------------------------------+ | shard_table | CREATE TABLE `shard_table` ( `c1` int(11) NOT NULL, `c2` int(11) DEFAULT NULL, PRIMARY KEY (`c1`) ) ENGINE=InnoDB DEFAULT CHARSET=latin1 COLLATE=latin1_bin | +-------------+--------------------------------------------------+移行タスクが正常かどうかを確認するには、
query-status
を使用します。
影響
shard-ddl-lock unlock
を使用して手動でロックのロックを解除した後、タスク構成情報に含まれるオフライン MySQL ソースを処理しないと、次のシャーディング DDL イベントを受信したときにロックを自動的に移行できない可能性があります。
したがって、DDL ロックを手動でロック解除した後、次の操作を実行する必要があります。
- 実行中のタスクを停止するには
stop-task
を使用します。 - タスク構成ファイルを更新し、構成ファイルからオフライン MySQL ソースの関連情報を削除します。
start-task
と新しいタスク構成ファイルを使用してタスクを再開します。
ノート:
shard-ddl-lock unlock
を実行した後、オフラインになった MySQL ソースが再ロードされ、DM ワーカーがシャード テーブルのデータを移行しようとすると、データとダウンストリーム テーブル構造の間で一致エラーが発生する可能性があります。
シナリオ 2: DDL ロック解除プロセス中に一部の DM ワーカーが異常停止するか、ネットワーク障害が発生する
異常ロックの原因
DM-master
がすべての DM ワーカーの DDL イベントを受信した後、自動的に実行されるunlock DDL lock
は、主に次の手順が含まれます。
- ロックの所有者に DDL を実行して、対応するシャード テーブルのチェックポイントを更新するように依頼します。
- 所有者が DDL を正常に実行した後、
DM-master
に保存されている DDL ロック情報を削除します。 - 他のすべての非所有者に、DDL をスキップし、所有者が DDL を正常に実行した後、対応するシャード テーブルのチェックポイントを更新するように依頼します。
- DM マスターは、すべての所有者または非所有者の操作が成功した後、対応する DDL ロック情報を削除します。
現在、上記のロック解除プロセスはアトミックではありません。非所有者が DDL 操作を正常にスキップした場合、非所有者が配置されている DM ワーカーが異常停止するか、ダウンストリーム TiDB でネットワーク異常が発生し、チェックポイントの更新が失敗する可能性があります。
非所有者に対応する MySQL ソースがデータ移行を復元すると、非所有者は、例外が発生する前に調整されていた DDL 操作を再調整するように DM マスターに要求しようとし、他のソースから対応する DDL 操作を受け取ることはありません。 MySQL ソース。これにより、DDL 操作によって対応するロックが自動的にロック解除される可能性があります。
手動による解決策
ここで、上流と下流のテーブル構造が同じであり、テーブルのマージと移行に対する要求が一部の MySQL ソースが削除されましたの手動ソリューションと同じであると仮定します。
DM-master
がロック解除プロセスを自動的に実行すると、所有者 ( mysql-replica-01
) は DDL を正常に実行し、移行プロセスを続行します。ただし、非所有者 ( mysql-replica-02
) に DDL 操作のスキップを要求するプロセスでは、対応する DM ワーカーが再起動されたため、DM ワーカーが DDL 操作をスキップした後、チェックポイントの更新に失敗します。
mysql-replica-02
に対応するデータ移行サブタスクが復元された後、DM マスター上に新しいロックが作成されますが、他の MySQL ソースは DDL 操作を実行またはスキップし、後続の移行を実行しています。
操作プロセスは次のとおりです。
shard-ddl-lock
を使用して、DDL の対応するロックがDM-master
に存在するかどうかを確認します。synced
状態にあるのはmysql-replica-02
つだけです。» shard-ddl-lock { "result": true, "msg": "", "locks": [ { "ID": "test-`shard_db`.`shard_table`", "task": "test", "mode": "pessimistic" "owner": "mysql-replica-02", "DDLs": [ "USE `shard_db`; ALTER TABLE `shard_db`.`shard_table` ADD COLUMN `c2` int(11);" ], "synced": [ "mysql-replica-02" ], "unsynced": [ "mysql-replica-01" ] } ] }shard-ddl-lock
を使用してDM-master
にロックの解除を依頼します。ロック解除プロセス中に、所有者はダウンストリームへの DDL 操作を再度実行しようとします (再起動前の元の所有者は一度ダウンストリームへの DDL 操作を実行しています)。 DDL 操作が複数回実行できることを確認してください。
shard-ddl-lock unlock test-`shard_db`.`shard_table` { "result": true, "msg": "", }
DDL ロックが正常にロック解除されたかどうかを確認するには、
shard-ddl-lock
を使用します。移行タスクが正常かどうかを確認するには、
query-status
を使用します。
影響
手動でロックを解除した後は、次のシャーディング DDL を自動的かつ正常に移行できます。