📣

TiDB Cloud Premium はパブリックプレビュー中です。エンタープライズワークロード向けの無制限のスケーリング、即時の弾力性、高度なセキュリティを提供します。このページは自動翻訳されたものです。原文はこちらからご覧ください。

TiDBについて
クイックスタート
発展
デプロイ
移行する
統合
管理
監視と警告
トラブルシューティング
性能チューニング
チュートリアル
TiDB ツール
参照
よくある質問
リリースノート

シャードマージシナリオでのデータ移行のベストプラクティス

このドキュメントでは、シャードマージシナリオにおけるTiDB データ移行 (DM) の機能と制限について説明し、アプリケーションのデータ移行のベストプラクティスガイドを提供します (デフォルトの "悲観的" モードが使用されます)。

別のデータ移行タスクを使用する

シャードテーブルからのデータのマージと移行のドキュメントでは、「シャーディンググループ」の定義が示されています。シャーディンググループは、マージして同じダウンストリームテーブルに移行する必要があるすべてのアップストリームテーブルで構成されます。

現在のシャーディング DDL メカニズムには、さまざまなシャードテーブルでの DDL 操作によってもたらされるスキーマの変更を調整するための機能が利用制限かあります。予期しない理由でこれらの制限に違反した場合は、データ移行タスク全体をDM でシャーディング DDL ロックを手動で処理する実行するか、やり直す必要があります。

例外が発生した場合のデータ移行への影響を軽減するには、各シャーディンググループを個別のデータ移行タスクとしてマージおよび移行することをお勧めします。これにより、少数のデータ移行タスクのみを手動で処理する必要があり、他のタスクは影響を受けないままにすることができます。

シャーディング DDL ロックを手動で処理する

DM のシャーディング DDL ロックは、アップストリームの複数のシャードテーブルからダウンストリームへの DDL 操作の実行を調整するためのメカニズムであることは、シャードテーブルからのデータのマージと移行から簡単に結論付けることができます。

したがって、コマンドDM-master ～ shard-ddl-lockでシャーディング DDL ロックが検出された場合、または一部の DM-worker でコマンドquery-statusからunresolvedGroupsまたはblockingDDLs検出された場合は、急いでshard-ddl-lock unlockコマンドを使用してシャーディング DDL ロックを手動で解放しないでください。

代わりに、次のことができます。

シャーディング DDL ロックの自動解放の失敗が列挙された異常なシナリオつである場合は、対応する手動の解決策に従ってシナリオを処理します。
サポートされていないシナリオの場合は、データ移行タスク全体をやり直します。まず、ダウンストリームデータベースのデータと、移行タスクに関連付けられたdm_meta情報を空にします。次に、完全および増分データ複製を再実行します。

複数のシャードテーブル間で主キーまたは一意のインデックス間の競合を処理する

複数のシャードテーブルからのデータは、主キーまたは一意のインデックス間で競合を引き起こす可能性があります。これらのシャードテーブルのシャーディングロジックに基づいて、各主キーまたは一意のインデックスを確認する必要があります。主キーまたは一意のインデックスに関連する 3 つのケースを次に示します。

シャードキー: 通常、同じシャードキーは 1 つのシャードテーブルにのみ存在します。つまり、シャードキーでデータの競合は発生しません。
自動インクリメント主キー: 各シャードテーブルの自動インクリメント主キーは個別にカウントされるため、それらの範囲が重複する可能性があります。この場合、次のセクション自動インクリメント主キーの競合を処理するを参照して解決する必要があります。
その他の主キーまたは一意のインデックス: ビジネスロジックに基づいて分析する必要があります。データが競合する場合は、次のセクション自動インクリメント主キーの競合を処理するを参照して解決することもできます。

自動インクリメント主キーの競合を処理する

このセクションでは、自動インクリメント主キーの競合を処理するための 2 つの推奨ソリューションを紹介します。

列から`PRIMARY KEY`属性を削除します

上流のスキーマが次のとおりであるとします。

CREATE TABLE `tbl_no_pk` (
  `auto_pk_c1` bigint(20) NOT NULL,
  `uk_c2` bigint(20) NOT NULL,
  `content_c3` text,
  PRIMARY KEY (`auto_pk_c1`),
  UNIQUE KEY `uk_c2` (`uk_c2`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1

次の要件が満たされている場合:

auto_pk_c1列はアプリケーションに影響を与えず、列のPRIMARY KEY属性に依存しません。
uk_c2列にはUNIQUE KEY属性があり、上流のすべてのシャードテーブルでグローバルに一意です。

次に、次の手順を実行して、シャードテーブルをマージするときにauto_pk_c1列が原因である可能性があるERROR 1062 (23000): Duplicate entry '***' for key 'PRIMARY'エラーを修正できます。

完全なデータ移行の前に、ダウンストリームデータベースにデータのマージと移行用のテーブルを作成し、 auto_pk_c1列のPRIMARY KEY属性を通常のインデックスに変更します。
```
CREATE TABLE `tbl_no_pk_2` (
  `auto_pk_c1` bigint(20) NOT NULL,
  `uk_c2` bigint(20) NOT NULL,
  `content_c3` text,
  INDEX (`auto_pk_c1`),
  UNIQUE KEY `uk_c2` (`uk_c2`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1
```
次の構成をtask.yamlに追加して、自動インクリメント主キーの競合のチェックをスキップします。
```
ignore-checking-items: ["auto_increment_ID"]
```
完全および増分データ複製タスクを開始します。
query-statusを実行して、データ移行タスクが正常に処理されたかどうか、および上流のデータが既にマージされて下流のデータベースに移行されているかどうかを確認します。

複合主キーを使用する

上流のスキーマが次のとおりであるとします。

CREATE TABLE `tbl_multi_pk` (
  `auto_pk_c1` bigint(20) NOT NULL,
  `uuid_c2` bigint(20) NOT NULL,
  `content_c3` text,
  PRIMARY KEY (`auto_pk_c1`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1

次の要件が満たされている場合:

アプリケーションは、 auto_pk_c1列のPRIMARY KEY属性に依存しません。
auto_pk_c1とuuid_c2列で構成される複合主キーは、グローバルに一意です。
アプリケーションで複合主キーを使用することは許容されます。

次に、次の手順を実行して、シャードテーブルをマージするときにauto_pk_c1列が原因である可能性があるERROR 1062 (23000): Duplicate entry '***' for key 'PRIMARY'エラーを修正できます。

完全なデータ移行の前に、データのマージと移行のためにダウンストリームデータベースにテーブルを作成します。 auto_pk_c1列にはPRIMARY KEY属性を指定せず、 auto_pk_c1とuuid_c2列を使用して複合主キーを構成します。
```
CREATE TABLE `tbl_multi_pk_c2` (
  `auto_pk_c1` bigint(20) NOT NULL,
  `uuid_c2` bigint(20) NOT NULL,
  `content_c3` text,
  PRIMARY KEY (`auto_pk_c1`,`uuid_c2`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1
```
完全および増分データ移行タスクを開始します。
query-statusを実行して、データ移行タスクが正常に処理されたかどうか、およびアップストリームからのデータが既にマージされてダウンストリームデータベースに移行されているかどうかを確認します。

アップストリーム RDS にシャードテーブルが含まれている場合の特別な処理

アップストリームデータソースが RDS であり、シャードテーブルが含まれている場合、SQL クライアントに接続するときに、MySQL binlogのテーブル名が表示されないことがあります。たとえば、アップストリームが UCloud 分散データベースである場合、 binlogのテーブル名には追加のプレフィックス_0001が含まれる場合があります。したがって、SQL クライアントのテーブル名ではなく、 binlogのテーブル名に基づいてテーブルルーティングを構成する必要があります。

アップストリームでのテーブルの作成/削除

シャードテーブルからのデータのマージと移行では、シャーディング DDL ロックの調整が、ダウンストリームデータベースがすべてのアップストリームシャードテーブルの DDL ステートメントを受信するかどうかに依存することは明らかです。さらに、DM は現在、アップストリームでシャードテーブルを動的に作成または削除することをサポートしていません。したがって、アップストリームでシャードテーブルを作成または削除するには、次の手順を実行することをお勧めします。

アップストリームでシャードテーブルを作成する

アップストリームで新しいシャードテーブルを作成する必要がある場合は、次の手順を実行します。

アップストリームのシャードテーブルで実行されたすべてのシャーディング DDL の調整が完了するまで待ちます。
stop-taskを実行して、データ移行タスクを停止します。
アップストリームに新しいシャードテーブルを作成します。
task.yamlファイルの構成により、新しく追加されたシャードテーブルを 1 つのダウンストリームテーブルで他の既存のシャードテーブルとマージできることを確認します。
start-taskを実行してタスクを開始します。
query-statusを実行して、データ移行タスクが正常に処理されたかどうか、およびアップストリームからのデータが既にマージされてダウンストリームデータベースに移行されているかどうかを確認します。

アップストリームに分割されたテーブルをドロップする

アップストリームでシャードテーブルを削除する必要がある場合は、次の手順を実行します。

分割されたテーブルを削除し、 SHOW BINLOG EVENTSを実行してbinlogイベントのDROP TABLEステートメントに対応するEnd_log_posをフェッチし、それをPos-Mとしてマークします。
query-statusを実行して、DM によって処理されたbinlogイベントに対応する位置 ( syncerBinlog ) をフェッチし、それをPos-Sとしてマークします。
Pos-SがPos-Mより大きい場合は、DM がDROP TABLEのステートメントをすべて処理したことを意味し、ドロップ前のテーブルのデータはダウンストリームに移行されているため、後続の操作を実行できます。それ以外の場合は、DM がデータの移行を完了するまで待ちます。
stop-taskを実行してタスクを停止します。
task.yamlファイルの構成が、アップストリームで削除されたシャードテーブルを無視していることを確認してください。
start-taskを実行してタスクを開始します。
query-statusを実行して、データ移行タスクが正常に処理されたかどうかを確認します。

速度制限と交通流制御

複数のアップストリーム MySQL または MariaDB インスタンスからのデータがマージされ、ダウンストリームの同じ TiDB クラスターに移行されると、各アップストリームインスタンスに対応するすべての DM-worker が完全な増分データレプリケーションを同時に実行します。これは、DM ワーカーの数が増えるとデフォルトの同時実行度 (完全データ移行ではpool-size 、増分データレプリケーションではworker-count ) が累積され、ダウンストリームデータベースが過負荷になる可能性があることを意味します。この場合、TiDB と DM の監視メトリックに基づいて予備的なパフォーマンス分析を行い、各同時実行パラメーターの値を調整する必要があります。将来、DM は部分的に自動化されたトラフィックフロー制御をサポートする予定です。

シャード マージ シナリオでのデータ移行のベスト プラクティス