TiDB バックアップと復元の概要

TiDB は、 Raftプロトコルと合理的なデプロイメント トポロジに基づいて、クラスターの高可用性を実現します。クラスター内のいくつかのノードに障害が発生しても、クラスターは引き続き使用できます。これに基づいて、データの安全性をさらに確保するために、TiDB は、自然災害や誤操作からデータを回復するための最後の手段として、バックアップと復元 (BR) 機能を提供します。

BR は次の要件を満たします。

  • 最短 5 分の RPO でクラスター データを災害復旧 (DR) システムにバックアップし、災害シナリオでのデータ損失を削減します。
  • エラー イベント前の時点にデータをロールバックすることで、アプリケーションからの誤操作のケースを処理します。
  • 司法監督の要件を満たすために履歴データ監査を実行します。
  • 本番環境を複製すると、トラブルシューティング、パフォーマンス チューニング、シミュレーション テストに便利です。

使用する前に

このセクションでは、制限事項、使用上のヒント、互換性の問題など、TiDB バックアップと復元を使用するための前提条件について説明します。

制限

  • PITR は空のクラスターへのデータの復元のみをサポートします。
  • PITR はクラスター レベルの復元のみをサポートし、データベース レベルまたはテーブル レベルの復元はサポートしません。
  • PITR は、システム テーブルからユーザー テーブルまたは権限テーブルのデータを復元することをサポートしていません。
  • BR は、クラスター上で複数のバックアップ タスクを同時に実行することをサポートしていません。
  • BR は、クラスター上でスナップショット バックアップ タスクとデータ復元タスクを同時に実行することをサポートしていません。
  • PITR の実行中は、ログ バックアップ タスクを実行したり、TiCDC を使用してデータをダウンストリーム クラスターに複製したりすることはできません。

いくつかのヒント

スナップショットバックアップ:

  • アプリケーションへの影響を最小限に抑えるために、オフピーク時間帯にバックアップ操作を実行することをお勧めします。
  • 複数のバックアップ タスクまたは復元タスクを 1 つずつ実行することをお勧めします。複数のバックアップ タスクを並行して実行すると、パフォーマンスが低下します。さらに悪いことに、複数のタスク間の連携が不十分な場合、タスクが失敗し、クラスターのパフォーマンスに影響する可能性があります。

スナップショットの復元:

  • BR はターゲット クラスターのリソースを可能な限り使用します。そのため、新しいクラスターまたはオフライン クラスターにデータを復元することをお勧めします。本番クラスターにデータを復元することは避けてください。そうしないと、アプリケーションが必然的に影響を受けます。

バックアップstorageとネットワーク構成:

  • バックアップ データは、Amazon S3、GCS、または Azure Blob Storage と互換性のあるstorageシステムに保存することをお勧めします。
  • BR、TiKV、およびバックアップstorageシステムに十分なネットワーク帯域幅があり、バックアップstorageシステムが十分な読み取りおよび書き込みパフォーマンス (IOPS) を提供できることを確認する必要があります。そうでない場合、バックアップおよび復元中にパフォーマンスのボトルネックになる可能性があります。

バックアップと復元を使用する

BRの使用方法は、TiDB の展開方法によって異なります。このドキュメントでは、オンプレミス展開で br コマンドライン ツールを使用して TiDB クラスター データをバックアップおよび復元する方法を紹介します。

他の展開シナリオでこの機能を使用する方法については、次のドキュメントを参照してください。

BR機能

TiDB BR は次の機能を提供します。

  • クラスター データのバックアップ: 特定の時点のクラスターの完全なデータ (フル バックアップ) をバックアップしたり、TiDB のデータの変更 (ログ バックアップ、ログは TiKV の KV 変更を意味します) をバックアップしたりできます。

  • バックアップデータを復元します:

    • 完全バックアップまたは完全バックアップ内の特定のデータベースやテーブルを復元できます。
    • バックアップ データ (フル バックアップとログ バックアップ) に基づいて、ターゲット クラスターをバックアップ クラスターの任意の時点に復元できます。このタイプの復元は、ポイントインタイム リカバリ (略して PITR) と呼ばれます。

クラスターデータをバックアップする

フル バックアップは、特定の時点のクラスターのすべてのデータをバックアップします。TiDB は、次のフル バックアップ方法をサポートしています。

  • クラスター スナップショットのバックアップ: TiDB クラスターのスナップショットには、特定の時点におけるトランザクション的に一貫性のあるデータが含まれています。詳細については、 スナップショットバックアップ参照してください。

フルバックアップは多くのstorageスペースを占有し、特定の時点のクラスターデータのみが含まれます。必要に応じて復元ポイントを選択する場合、つまりポイントインタイムリカバリ (PITR) を実行する場合は、次の 2 つのバックアップ方法を同時に使用できます。

  • 開始ログバックアップ 。ログ バックアップが開始されると、タスクはすべての TiKV ノードで実行され続け、指定されたstorageに TiDB 増分データを小さなバッチで定期的にバックアップします。
  • スナップショット バックアップを定期的に実行します。クラスター データ全体をバックアップstorageにバックアップします。たとえば、毎日午前 0 時にクラスター スナップショット バックアップを実行します。

バックアップのパフォーマンスと TiDB クラスターへの影響

  • クラスターの CPU および I/O リソースが十分であれば、スナップショット バックアップによる TiDB クラスターへの影響は限定的であり、通常は 20% 未満にとどまります。TiDB クラスターを適切に構成すると、この影響はさらに 10% 以下にまで最小限に抑えることができます。CPU および I/O リソースが不十分な場合は、TiKV 構成項目backup.num-threadsを調整して、バックアップ タスクで使用されるワーカー スレッドの数を変更し、バックアップ タスクによる TiDB クラスターへの影響を軽減できます。TiKV ノードのバックアップ速度はスケーラブルで、50 MB/秒から 100 MB/秒の範囲です。詳細については、 バックアップのパフォーマンスと影響を参照してください。
  • ログ バックアップ タスクのみの場合、クラスターへの影響は約 5% です。ログ バックアップは、最後の更新後に生成されたすべての変更を 3 ~ 5 分ごとにバックアップstorageにフラッシュするため、最短 5 分で復旧ポイント目標 (RPO) を達成できます。

バックアップデータを復元する

バックアップ機能に対応して、完全復元と PITR の 2 種類の復元を実行できます。

  • 完全バックアップを復元する

  • 任意の時点へのデータの復元 (PITR)

    • br restore pointコマンドを実行すると、リカバリ時点以前の最新のスナップショットバックアップデータと、指定した時刻までのログバックアップデータを復元できます。BRは自動的に復元範囲を決定し、バックアップデータにアクセスし、対象クラスターにデータを順番に復元します。

TiDB クラスタのパフォーマンスと影響を復元する

  • データの復元はスケーラブルな速度で実行されます。通常、速度は TiKV ノードあたり 100 MiB/秒です。1 br新しいクラスターへのデータの復元のみをサポートし、ターゲット クラスターのリソースを最大限に活用します。詳細については、 パフォーマンスとインパクトを回復するを参照してください。
  • 各 TiKV ノードでは、PITR は 30 GiB/h でログ データを復元できます。詳細については、 PITRのパフォーマンスと影響参照してください。

バックアップstorage

TiDB は、Amazon S3、Google Cloud Storage (GCS)、Azure Blob Storage、NFS、およびその他の S3 互換ファイルstorageサービスへのデータのバックアップをサポートしています。詳細については、次のドキュメントを参照してください。

互換性

他の機能との互換性

一部の TiDB 機能が有効または無効になっている場合、バックアップと復元が失敗する可能性があります。バックアップおよび復元中にこれらの機能が一貫して有効または無効になっていないと、互換性の問題が発生する可能性があります。

特徴問題解決
GBK 文字セットv5.4.0 より前のバージョンのBRでは、 charset=GBKテーブルの復元はサポートされていません。v5.4.0 より前のバージョンのBRでは、 charset=GBKテーブルの TiDB クラスターへの復元はサポートされていません。
クラスター化インデックス#565復元中のtidb_enable_clustered_indexグローバル変数の値がバックアップ中の値と一致していることを確認してください。一致していないと、 default not foundエラーやデータ インデックスの不一致などのデータの不整合が発生する可能性があります。
新しい照合順序#352復元中のmysql.tidbテーブルのnew_collation_enabled変数の値がバックアップ中の値と一致していることを確認してください。一致していないと、データ インデックスに不整合が発生し、チェックサムが合格しない可能性があります。詳細については、 FAQ - BRがnew_collations_enabled_on_first_bootstrapの不一致を報告するのはなぜですか?を参照してください。
グローバル一時テーブルデータのバックアップと復元には、 BRの v5.3.0 以降のバージョンを使用していることを確認してください。そうでない場合、バックアップされたグローバル一時テーブルの定義でエラーが発生します。
TiDB Lightning物理インポート上流データベースがTiDB Lightningの物理インポートモードを使用している場合、ログバックアップではデータをバックアップできません。データインポート後にフルバックアップを実行することをお勧めします。詳細については、 上流データベースが物理インポート モードでTiDB Lightningを使用してデータをインポートすると、ログ バックアップ機能が使用できなくなります。なぜでしょうか?を参照してください。

バージョンの互換性

注記:

バックアップと復元には、TiDB クラスターと同じメジャー バージョンのBRを使用することをお勧めします。

バックアップと復元を実行する前に、 BR はTiDB クラスターのバージョンを自身のバージョンと比較し、互換性をチェックします。バージョンに互換性がない場合、 BR はエラーを報告して終了します。バージョン チェックを強制的にスキップするには、 --check-requirements=false設定します。バージョン チェックをスキップすると、データに非互換性が生じる可能性があることに注意してください。

v7.0.0 以降、TiDB は SQL ステートメントによるバックアップおよび復元操作の実行を段階的にサポートしています。したがって、クラスター データをバックアップおよび復元するときは、TiDB クラスターと同じメジャー バージョンのBRツールを使用し、メジャー バージョン間でデータのバックアップおよび復元操作を実行しないようにすることを強くお勧めします。これにより、復元操作のスムーズな実行とデータの一貫性が確保されます。v7.6.0 以降、 BR はデフォルトで一部のmysqlシステム テーブルにデータを復元します。つまり、 --with-sys-tableオプションはデフォルトでtrueに設定されています。異なるバージョンの TiDB クラスターにデータを復元するときに、システム テーブルのスキーマが異なるために[BR:Restore:ErrRestoreIncompatibleSys]incompatible system tableに似たエラーが発生した場合は、 --with-sys-table=falseを設定してシステム テーブルの復元をスキップし、このエラーを回避できます。

TiDB v6.6.0 より前のBRの互換性情報は次のとおりです。

バックアップバージョン(縦)\ 復元バージョン(横)TiDB v6.0 への復元TiDB v6.1 への復元TiDB v6.2 への復元TiDB v6.3、v6.4、またはv6.5に復元TiDB v6.6 に復元
TiDB v6.0、v6.1、v6.2、v6.3、v6.4、または v6.5 スナップショット バックアップ互換性あり (既知の問題#36379 : バックアップ データに空のスキーマが含まれている場合、 BR はエラーを報告する可能性があります。)互換性がある互換性がある互換性がある互換性あり(BRはv6.6である必要があります)
TiDB v6.3、v6.4、v6.5、または v6.6 ログ バックアップ非互換非互換非互換互換性がある互換性がある

参照

このページは役に立ちましたか?