TiDB 移行ツールの概要
TiDB は、完全なデータ移行、増分データ移行、バックアップと復元、データ複製など、さまざまなシナリオに対応する複数のデータ移行ツールを提供します。
このドキュメントでは、これらのツールのユーザーシナリオ、サポートされるアップストリームとダウンストリーム、利点、制限事項についてご紹介します。ニーズに合わせて適切なツールをお選びいただけます。
TiDB データ移行 (DM)
- ユーザーシナリオ: MySQL互換データベースからTiDBへのデータ移行
- アップストリーム: MySQL、MariaDB、 Aurora
- 下流:TiDB
- 利点:
- 完全なデータ移行と増分レプリケーションをサポートする、便利で統合されたデータ移行タスク管理ツール
- フィルタリングテーブルと操作をサポート
- シャードのマージと移行をサポート
- 制限事項:データのインポート速度はTiDB Lightning 論理インポートモードとほぼ同等で、TiDB Lightning 物理インポートモードよりも大幅に遅くなります。そのため、1TiB未満のデータ全体を移行する場合は、DMを使用することをお勧めします。
TiDB Lightning
- ユーザーシナリオ: TiDBへの完全なデータのインポート
- 上流(インポートされたソースファイル) :
- Dumplingからエクスポートされたファイル
- Amazon Aurora、Apache Hive、Snowflake によってエクスポートされた Parquet ファイル
- CSVファイル
- ローカルディスクまたは Amazon S3 からのデータ
- 下流:TiDB
- 利点:
- 大量のデータを迅速にインポートし、TiDB クラスタ内の特定のテーブルを迅速に初期化することをサポートします。
- インポートの進行状況を保存するチェックポイントをサポートし、再起動後に中断したところからインポートを続行します
tidb-lightning - データフィルタリングをサポート
- 制限事項:
- データのインポートに物理インポートモード使用すると、インポート プロセス中に TiDB クラスターはサービスを提供できません。
- TiDB サービスに影響を与えたくない場合は、 TiDB Lightning 論理インポートモードに従ってデータのインポートを実行してください。
Dumpling
- ユーザーシナリオ: MySQLまたはTiDBからの完全なデータエクスポート
- アップストリーム: MySQL、TiDB
- 下流(出力ファイル) : SQL、CSV
- 利点:
- データのフィルタリングを容易にするテーブルフィルタ機能をサポート
- Amazon S3へのデータのエクスポートをサポート
- おすすめ:
- エクスポートしたデータを TiDB 以外のデータベースに復元する場合は、 Dumplingを使用することをお勧めします。
- エクスポートしたデータを別の TiDB クラスターに復元する場合は、バックアップと復元 (BR) を使用することをお勧めします。
TiCDC
- ユーザーシナリオ:このツールは、TiKVの変更ログをプルすることで実装されます。これにより、クラスターデータを上流のTSOと整合性のある状態に復元し、他のシステムがデータ変更をサブスクライブできるようになります。
- 上流:TiDB
- ダウンストリーム: TiDB、MySQL、Kafka、MQ、Confluent、Amazon S3、GCS、Azure Blob Storage、NFS などのstorageサービス。
- 利点:TiCDCオープンプロトコルを提供する
- 制限事項:TiCDCは、少なくとも1つの有効なインデックスを持つテーブルのみを複製します。以下のシナリオはサポートされていません。
- RawKV のみを使用する TiKV クラスター。
- DDL 操作
CREATE SEQUENCEと TiDB のSEQUENCE関数。
バックアップと復元 (BR)
- ユーザーシナリオ: データのバックアップとリストアによって大量の TiDB クラスターデータを移行する
- 上流:TiDB
- 下流(出力ファイル) : SST、backup.meta ファイル、backup.lock ファイル
- 利点:
- 別のTiDBクラスタへのデータ移行に適しています
- 災害復旧のための外部storageへのデータバックアップをサポート
- 制限事項:
- BR がTiCDC の上流クラスターにデータを復元する場合、復元されたデータは TiCDC によって下流に複製できません。
- BR は、
mysql.tidbテーブルで同じnew_collation_enabled値を持つクラスター間の操作のみをサポートします。
同期差分インスペクター
- ユーザーシナリオ: MySQLプロトコルを使用してデータベースに保存されたデータを比較する
- アップストリーム: TiDB、MySQL
- 下流: TiDB、MySQL
- 利点: 少量のデータが不整合なシナリオでデータを修復するために使用できます
- 制限事項:
- MySQL と TiDB 間のデータ移行ではオンライン チェックはサポートされていません。
- JSON、BIT、BINARY、BLOB などのタイプのデータはサポートされていません。
TiUPを使用してツールをインストールする
TiDB v4.0以降、 TiUPはTiDBエコシステム内のさまざまなクラスタコンポーネントの管理を支援するパッケージマネージャとして機能します。これにより、単一のコマンドであらゆるクラスタコンポーネントを管理できるようになりました。
ステップ1. TiUPをインストールする
curl --proto '=https' --tlsv1.2 -sSf https://tiup-mirrors.pingcap.com/install.sh | sh
グローバル環境変数を再宣言します。
source ~/.bash_profile
ステップ2. コンポーネントをインストールする
利用可能なコンポーネントを確認するには、次のコマンドを使用できます。
tiup list
このコマンドは利用可能なコンポーネントを出力します。
Available components:
Name Owner Description
---- ----- -----------
PCC community A tool used to capture plan changes among different versions of TiDB
bench pingcap Benchmark database with different workloads
br pingcap TiDB/TiKV cluster backup restore tool.
cdc pingcap CDC is a change data capture tool for TiDB
chaosd community An easy-to-use Chaos Engineering tool used to inject failures to a physical node
client pingcap Client to connect playground
cloud pingcap CLI tool to manage TiDB Cloud
cluster pingcap Deploy a TiDB cluster for production
ctl pingcap TiDB controller suite
dm pingcap Data Migration Platform manager
dmctl pingcap dmctl component of Data Migration Platform.
errdoc pingcap Document about TiDB errors
pd-recover pingcap PD Recover is a disaster recovery tool of PD, used to recover the PD cluster which cannot start or provide services normally.
playground pingcap Bootstrap a local TiDB cluster for fun
tidb pingcap TiDB is an open source distributed HTAP database compatible with the MySQL protocol.
tidb-dashboard pingcap TiDB Dashboard is a Web UI for monitoring, diagnosing, and managing the TiDB cluster
tidb-lightning pingcap TiDB Lightning is a tool used for fast full import of large amounts of data into a TiDB cluster
tikv-br pingcap TiKV cluster backup restore tool
tikv-cdc pingcap TiKV-CDC is a change data capture tool for TiKV
tiproxy pingcap TiProxy is a database proxy that is based on TiDB.
tiup pingcap TiUP is a command-line component management tool that can help to download and install TiDB platform components to the local system
必要なコンポーネントを1つ以上インストールします。例:
tiup install dm
tiup install dm tidb-lightning
注記:
特定のバージョンのコンポーネントをインストールするには、
tiup install <component>[:version]コマンドを使用します。
ステップ3. TiUPとそのコンポーネントを更新する(オプション)
新しいバージョンのリリース ログと互換性に関する注意事項を確認することをお勧めします。
tiup update --self && tiup update dm