テーブルのバッチ作成

データを復元するとき、バックアップと復元 (BR) は、ターゲットの TiDB クラスターにデータベースとテーブルを作成し、バックアップ データをテーブルに復元します。 TiDB v6.0.0 より前のバージョンでは、BR はシリアル実行実装を使用して復元プロセスでテーブルを作成します。ただし、BR が多数のテーブル (ほぼ 50000) を含むデータを復元する場合、この実装ではテーブルの作成に多くの時間がかかります。

テーブル作成プロセスを高速化し、データの復元時間を短縮するために、TiDB v6.0.0 で Batch Create Table 機能が導入されました。この機能はデフォルトで有効になっています。

ノート:

  • Batch Create Table 機能を使用するには、TiDB と BR の両方が v6.0.0 以降である必要があります。 TiDB または BR のいずれかが v6.0.0 より前の場合、BR はシリアル実行の実装を使用します。
  • クラスター管理ツール (TiUP など) を使用していて、TiDB と BR が v6.0.0 以降のバージョンであるか、TiDB と BR が v6.0.0 より前のバージョンから v6.0.0 以降にアップグレードされているとします。 .この場合、BR はデフォルトで Batch Create Table 機能を有効にします。

利用シーン

大量のテーブル (たとえば 50000 テーブル) を含むデータを復元する必要がある場合は、バッチ作成テーブル機能を使用して復元プロセスを高速化できます。

詳細な効果については、 バッチ作成テーブル機能のテストを参照してください。

テーブルの一括作成機能を使用する

BR は、デフォルトで Batch Create Table 機能を有効にします。v6.0.0 以降では、リストア プロセスを高速化するためにデフォルト設定が--ddl-batch-size=128になっています。したがって、このパラメーターを構成する必要はありません。 --ddl-batch-size=128は、BR がバッチでテーブルを作成し、各バッチに 128 個のテーブルがあることを意味します。

この機能を無効にするには、 --ddl-batch-size0を設定します。次のコマンド例を参照してください。

br restore full -s local:///br_data/ --pd 172.16.5.198:2379 --log-file restore.log --ddl-batch-size=0

この機能を無効にすると、BR は代わりにシリアル実行の実装を使用します。

実施原則

  • v6.0.0 より前のシリアル実行の実装:

    データを復元するとき、BR はターゲットの TiDB クラスターにデータベースとテーブルを作成し、バックアップ データをテーブルに復元します。テーブルを作成するために、BR は最初に TiDB 内部 API を呼び出し、次にテーブル作成タスクを処理します。これは、BR がCreate Tableのステートメントを実行するのと同様に機能します。 TiDB DDL 所有者はテーブルを順次作成します。 DDL 所有者がテーブルを作成すると、それに応じて DDL スキーマのバージョンが変更され、各バージョンの変更が他の TiDB DDL ワーカー (BR を含む) に同期されます。したがって、BR が多数のテーブルを復元する場合、シリアル実行の実装には時間がかかります。

  • v6.0.0 以降のバッチ作成テーブルの実装:

    デフォルトでは、BR は複数のバッチでテーブルを作成し、各バッチには 128 個のテーブルがあります。この実装を使用すると、BR がテーブルのバッチを 1 つ作成するときに、TiDB スキーマのバージョンが 1 回だけ変更されます。この実装により、テーブル作成の速度が大幅に向上します。

バッチ作成テーブル機能のテスト

このセクションでは、バッチ作成テーブル機能に関するテスト情報について説明します。テスト環境は次のとおりです。

  • クラスタ構成:

    • 15 個の TiKV インスタンス。各 TiKV インスタンスには、16 個の CPU コア、80 GB のメモリ、および RPC 要求を処理するための 16 個のスレッドが装備されています ( import.num-threads = 16)。
    • 3 つの TiDB インスタンス。各 TiDB インスタンスには、16 個の CPU コア、32 GB のメモリが搭載されています。
    • 3 つの PD インスタンス。各 PD インスタンスには、16 個の CPU コア、32 GB のメモリが搭載されています。
  • 復元するデータのサイズ: 16.16 TB

テスト結果は次のとおりです。

'[2022/03/12 22:37:49.060 +08:00] [INFO] [collector.go:67] ["Full restore success summary"] [total-ranges=751760] [ranges-succeed=751760] [ranges-failed=0] [split-region=1h33m18.078448449s] [restore-ranges=542693] [total-take=1h41m35.471476438s] [restore-data-size(after-compressed)=8.337TB] [Size=8336694965072] [BackupTS=431773933856882690] [total-kv=148015861383] [total-kv-size=16.16TB] [average-speed=2.661GB/s]'

テスト結果から、1 つの TiKV インスタンスを復元する平均速度は 181.65 MB/秒 ( average-speedに等しい) であることがわかりtikv_count

エコシステム
TiDB
TiKV
TiSpark
Chaos Mesh
© 2022 PingCAP. All Rights Reserved.