TiDB Lightning の概要
TiDB Lightning 、TB 規模のデータを TiDB クラスターにインポートするために使用されるツールです。TiDB クラスターへの初期データ インポートによく使用されます。
TiDB Lightning は次のファイル形式をサポートしています。
- Dumplingによってエクスポートされたファイル
- CSVファイル
- Amazon Auroraによって生成された Apache Parquet ファイル
TiDB Lightning は次のソースからデータを読み取ることができます。
注記:
TiDB Lightningと比較すると、
IMPORT INTO
ステートメントは TiDB ノード上で直接実行でき、自動化された分散タスク スケジューリングとTiDB グローバルソートをサポートし、デプロイメント、リソース使用率、タスク構成の利便性、呼び出しと統合の容易さ、高可用性、スケーラビリティが大幅に向上しています。適切なシナリオでは、 TiDB LightningではなくIMPORT INTO
使用を検討することをお勧めします。
TiDB Lightningアーキテクチャ
TiDB Lightning は、 backend
で設定された 2 つのインポート モードをサポートしています。インポート モードによって、データが TiDB にインポートされる方法が決まります。
物理インポートモード : TiDB Lightning は、まずデータをキーと値のペアにエンコードしてローカルの一時ディレクトリに保存し、次にこれらのキーと値のペアを各 TiKV ノードにアップロードし、最後に TiKV 取り込みインターフェイスを呼び出して TiKV の RocksDB にデータを挿入します。初期インポートを実行する必要がある場合は、インポート速度が速い物理インポート モードを検討してください。物理インポート モードのバックエンドは
local
です。論理インポートモード : TiDB Lightning は最初にデータを SQL 文にエンコードし、次にこれらの SQL 文を直接実行してデータをインポートします。インポートするクラスターが本番にある場合、またはインポートするターゲット テーブルにすでにデータが含まれている場合は、論理インポート モードを使用します。論理インポート モードのバックエンドは
tidb
です。
インポートモード | 物理インポートモード | 論理インポートモード |
---|---|---|
バックエンド | local | tidb |
スピード | 高速 (100~500 GiB/時間) | 低 (10~50 GiB/時間) |
資源消費 | 高い | 低い |
ネットワーク帯域幅の消費 | 高い | 低い |
インポート時のACID準拠 | いいえ | はい |
ターゲットテーブル | 空である必要があります | データを含むことができる |
TiDB クラスタ バージョン | = 4.0.0 | 全て |
TiDBクラスタがインポート中にサービスを提供できるかどうか | 限定サービス | はい |