📣

TiDB Cloud Premium はパブリックプレビュー中です。エンタープライズワークロード向けの無制限のスケーリング、即時の弾力性、高度なセキュリティを提供します。このページは自動翻訳されたものです。原文はこちらからご覧ください。

ある TiDBクラスタから別の TiDBクラスタに移行する

このドキュメントでは、あるTiDBクラスタから別のTiDBクラスタにデータを移行する方法について説明します。この機能は、以下のシナリオに適用されます。

データベースの分割: TiDB クラスターが大きすぎる場合、またはクラスターのサービス間への影響を避けたい場合は、データベースを分割できます。
データベースの再配置: データセンターの変更など、データベースを物理的に再配置します。
新しいバージョンの TiDB クラスターにデータを移行する: データのセキュリティと精度の要件を満たすために、新しいバージョンの TiDB クラスターにデータを移行します。

このドキュメントでは、移行プロセス全体を例示し、次の手順について説明します。

環境を設定します。
全データを移行します。
増分データを移行します。
サービスを新しい TiDB クラスターに移行します。

ステップ1. 環境を設定する

TiDB クラスターをデプロイ。
TiUP Playgroundを使用して、アップストリームとダウンストリームにそれぞれ1つずつ、2つのTiDBクラスタをデプロイ。詳細については、 TiUPを使用してオンライン TiDBクラスタをデプロイおよび管理を参照してください。
```
# Create an upstream cluster
tiup --tag upstream playground --host 0.0.0.0 --db 1 --pd 1 --kv 1 --tiflash 0 --ticdc 1
# Create a downstream cluster
tiup --tag downstream playground --host 0.0.0.0 --db 1 --pd 1 --kv 1 --tiflash 0 --ticdc 1
# View cluster status
tiup status
```

データを初期化します。

デフォルトでは、新しくデプロイされたクラスターにテストデータベースが作成されます。そのため、 Sysbench使用してテストデータを生成し、実際のシナリオでデータをシミュレートできます。

sysbench oltp_write_only --config-file=./tidb-config --tables=10 --table-size=10000 prepare

このドキュメントでは、sysbenchを使用してoltp_write_onlyスクリプトを実行します。このスクリプトは、テストデータベースに10個のテーブル（それぞれ10,000行）を生成します。tidb-configは以下のとおりです。

mysql-host=172.16.6.122 # Replace the value with the IP address of your upstream cluster
mysql-port=4000
mysql-user=root
mysql-password=
db-driver=mysql         # Set database driver to MySQL
mysql-db=test           # Set the database as a test database
report-interval=10      # Set data collection period to 10s
threads=10              # Set the number of worker threads to 10
time=0                  # Set the time required for executing the script. O indicates time unlimited
rate=100                # Set average TPS to 100

サービスのワークロードをシミュレートします。
実際のシナリオでは、サービスデータは上流クラスターに継続的に書き込まれます。このドキュメントでは、sysbenchを使用してこのワークロードをシミュレートします。具体的には、以下のコマンドを実行して、10人のワーカーが3つのテーブル（sbtest1、sbtest2、sbtest3）に継続的にデータを書き込むようにし、合計TPSが100を超えないようにします。
```
sysbench oltp_write_only --config-file=./tidb-config --tables=3 run
```
外部ストレージを準備します。
フルデータバックアップでは、上流クラスターと下流クラスターの両方がバックアップファイルにアクセスする必要があります。バックアップファイルの保存には外部ストレージ使用することをお勧めします。このドキュメントでは、Minioを使用してS3互換ストレージサービスをシミュレートします。
```
wget https://dl.min.io/server/minio/release/linux-amd64/minio
chmod +x minio
# Configure access-key access-screct-id to access minio
export HOST_IP='172.16.6.122' # Replace the value with the IP address of your upstream cluster
export MINIO_ROOT_USER='minio'
export MINIO_ROOT_PASSWORD='miniostorage'
# Create the database directory. backup is the bucket name.
mkdir -p data/backup
# Start minio at port 6060
./minio server ./data --address :6060 &
```
上記のコマンドは、S3サービスをシミュレートするために、1つのノードでminioサーバーを起動します。コマンドのパラメータは以下のように設定されています。
- エンドポイント: http://${HOST_IP}:6060/
- アクセスキー: minio
- シークレットアクセスキー: miniostorage
- バケット: backup
アクセスリンクは以下のとおりです。
```
s3://backup?access-key=minio&secret-access-key=miniostorage&endpoint=http://${HOST_IP}:6060&force-path-style=true
```

ステップ2. 全データの移行

環境構築後、 BRのバックアップ・リストア関数を使用して全データを移行できます。BRは3つの方法で起動できます。本稿では、SQL文BACKUPとRESTORE使用します。

注記：
BACKUPとRESTORE SQL 文は実験的です。本番環境での使用は推奨されません。予告なく変更または削除される可能性があります。バグを発見した場合は、GitHub で問題報告してください。
本番のクラスタでは、GCを無効にしてバックアップを実行すると、クラスタのパフォーマンスに影響する可能性があります。パフォーマンスの低下を防ぐため、オフピーク時にデータのバックアップを実行し、 RATE_LIMIT適切な値に設定することをお勧めします。
アップストリームクラスタとダウンストリームクラスタのバージョンが異なる場合は、 BR互換性確認する必要があります。このドキュメントでは、アップストリームクラスタとダウンストリームクラスタは同じバージョンであると想定しています。

GC を無効にします。
増分マイグレーション中に新しく書き込まれたデータが削除されないようにするには、バックアップ前に上流クラスターのGCを無効にする必要があります。これにより、履歴データが削除されなくなります。
GC を無効にするには、次のコマンドを実行します。
```
MySQL [test]> SET GLOBAL tidb_gc_enable=FALSE;
```
```
Query OK, 0 rows affected (0.01 sec)
```
変更が有効になっていることを確認するには、 tidb_gc_enableの値を照会します。
```
MySQL [test]> SELECT @@global.tidb_gc_enable;
```
```
+-------------------------+:
| @@global.tidb_gc_enable |
+-------------------------+
|                       0 |
+-------------------------+
1 row in set (0.00 sec)
```
注記：
TiCDC gc-ttlデフォルトで24時間です。バックアップと復元に時間がかかる場合、デフォルトのgc-ttl不十分で、その後の増分レプリケーションタスク失敗する可能性があります。このような状況を回避するには、TiCDCサーバーを起動する際に、特定のニーズに合わせてgc-ttl値を調整してください。詳細については、 TiCDCにおけるgc-ttlとは参照してください。

データをバックアップします。

データをバックアップするには、アップストリームクラスターでBACKUPステートメントを実行します。

MySQL [(none)]> BACKUP DATABASE * TO 's3://backup?access-key=minio&secret-access-key=miniostorage&endpoint=http://${HOST_IP}:6060&force-path-style=true' RATE_LIMIT = 120 MB/SECOND;

+---------------+----------+--------------------+---------------------+---------------------+
| Destination   | Size     | BackupTS           | Queue Time          | Execution Time      |
+---------------+----------+--------------------+---------------------+---------------------+
| s3://backup   | 10315858 | 431434047157698561 | 2022-02-25 19:57:59 | 2022-02-25 19:57:59 |
+---------------+----------+--------------------+---------------------+---------------------+
1 row in set (2.11 sec)

BACKUPコマンドの実行後、TiDB はバックアップデータに関するメタデータを返します。3 はバックアップ前に生成されたデータなので、ご注意ください。このドキュメントでは、 BackupTS BackupTSデータチェックの終了とTiCDC による増分移行スキャンの開始として使用します。

データを復元します。

ダウンストリームクラスターでRESTOREコマンドを実行してデータを復元します。

mysql> RESTORE DATABASE * FROM 's3://backup?access-key=minio&secret-access-key=miniostorage&endpoint=http://${HOST_IP}:6060&force-path-style=true';

+--------------+-----------+--------------------+---------------------+---------------------+
| Destination  | Size      | BackupTS           | Queue Time          | Execution Time      |
+--------------+-----------+--------------------+---------------------+---------------------+
| s3://backup  | 10315858  | 431434141450371074 | 2022-02-25 20:03:59 | 2022-02-25 20:03:59 |
+--------------+-----------+--------------------+---------------------+---------------------+
1 row in set (41.85 sec)

(オプション) データを検証します。

同期差分インスペクター使用すると、特定の時刻における上流と下流のデータの整合性を確認できます。上記のBACKUP出力は、上流クラスターが 431434047157698561 にバックアップを完了したことを示しています。上記のRESTORE出力は、下流クラスターが 431434141450371074 に復元を完了したことを示しています。

sync_diff_inspector -C ./config.yaml

sync-diff-inspector の設定方法の詳細についてはコンフィグレーションファイルの説明参照してください。このドキュメントでは、設定は以下のとおりです。

# Diff Configuration.
######################### Datasource config #########################
[data-sources]
[data-sources.upstream]
    host = "172.16.6.122" # Replace the value with the IP address of your upstream cluster
    port = 4000
    user = "root"
    password = ""
    snapshot = "431434047157698561" # Set snapshot to the actual backup time (BackupTS in the "Back up data" section in [Step 2. Migrate full data](#step-2-migrate-full-data))
[data-sources.downstream]
    host = "172.16.6.125" # Replace the value with the IP address of your downstream cluster
    port = 4000
    user = "root"
    password = ""

######################### Task config #########################
[task]
    output-dir = "./output"
    source-instances = ["upstream"]
    target-instance = "downstream"
    target-check-tables = ["*.*"]

ステップ3. 増分データの移行

TiCDCをデプロイ。
完全なデータ移行が完了したら、増分データをレプリケーションするためのTiCDCをデプロイして設定します。本番環境では、 TiCDCをデプロイの手順に従ってTiCDCをデプロイしてください。このドキュメントでは、テストクラスターの作成時にTiCDCノードが起動済みであるため、TiCDCのデプロイ手順をスキップして、変更フィードの設定に進むことができます。
変更フィードを作成します。
アップストリームクラスターで次のコマンドを実行して、アップストリームクラスターからダウンストリームクラスターへの変更フィードを作成します。
```
tiup cdc cli changefeed create --server=http://172.16.6.122:8300 --sink-uri="mysql://root:@172.16.6.125:4000" --changefeed-id="upstream-to-downstream" --start-ts="431434047157698561"
```
このコマンドのパラメータは次のとおりです。
- --server : TiCDC クラスター内の任意のノードの IP アドレス
- --sink-uri : 下流クラスタのURI
- --changefeed-id : チェンジフィードID。正規表現の形式である必要があります。^[a-zA-Z0-9]+(-[a-zA-Z0-9]+)*$
- --start-ts : 変更フィードの開始タイムスタンプ。バックアップ時刻である必要があります (またはステップ2. 全データを移行するの「データのバックアップ」セクションの BackupTS)
changefeed 構成の詳細については、タスク設定ファイル参照してください。
GC を有効にします。
TiCDCを用いた増分移行では、GCは複製された履歴データのみを削除します。そのため、変更フィードを作成した後、以下のコマンドを実行してGCを有効にする必要があります。詳細はTiCDCガベージコレクション(GC) セーフポイントの完全な動作は何ですか?参照してください。
GC を有効にするには、次のコマンドを実行します。
```
MySQL [test]> SET GLOBAL tidb_gc_enable=TRUE;
```
```
Query OK, 0 rows affected (0.01 sec)
```
変更が有効になっていることを確認するには、 tidb_gc_enableの値を照会します。
```
MySQL [test]> SELECT @@global.tidb_gc_enable;
```
```
+-------------------------+
| @@global.tidb_gc_enable |
+-------------------------+
|                       1 |
+-------------------------+
1 row in set (0.00 sec)
```

ステップ4. 新しいTiDBクラスタにサービスを移行する

チェンジフィードを作成すると、上流クラスターに書き込まれたデータが低レイテンシーで下流クラスターに複製されます。読み取りトラフィックを下流クラスターに徐々に移行できます。しばらく観察してください。下流クラスターが安定している場合は、以下の手順で書き込みトラフィックを下流クラスターに移行できます。

アップストリームクラスタの書き込みサービスを停止します。変更フィードを停止する前に、アップストリームのすべてのデータがダウンストリームに複製されていることを確認してください。

# Stop the changefeed from the upstream cluster to the downstream cluster
tiup cdc cli changefeed pause -c "upstream-to-downstream" --server=http://172.16.6.122:8300

# View the changefeed status
tiup cdc cli changefeed list

[
  {
    "id": "upstream-to-downstream",
    "summary": {
    "state": "stopped",  # Ensure that the status is stopped
    "tso": 431747241184329729,
    "checkpoint": "2022-03-11 15:50:20.387", # This time must be later than the time of stopping writing
    "error": null
    }
  }
]

ダウンストリームからアップストリームへのチェンジフィードを作成します。アップストリームとダウンストリームのデータは一致しており、クラスターに新しいデータが書き込まれていないため、デフォルト設定を使用するにはstart-ts指定しないでください。
```
tiup cdc cli changefeed create --server=http://172.16.6.125:8300 --sink-uri="mysql://root:@172.16.6.122:4000" --changefeed-id="downstream -to-upstream"
```
書き込みサービスを下流クラスターに移行した後、しばらく観察します。下流クラスターが安定している場合は、上流クラスターを破棄できます。

ある TiDBクラスタから別の TiDBクラスタに移行する

ステップ1. 環境を設定する

ステップ2. 全データの移行

ステップ3. 増分データの移行

ステップ4. 新しいTiDBクラスタにサービスを移行する

このページは役に立ちましたか？