TiDB Lightning の概要

TiDB Lightning 、TB 規模のデータを TiDB クラスターにインポートするために使用されるツールです。TiDB クラスターへの初期データインポートによく使用されます。

TiDB Lightning は次のファイル形式をサポートしています。

Dumplingによってエクスポートされたファイル
CSVファイル
Amazon Auroraによって生成された Apache Parquet ファイル、Apache Hive、またはSnowflake

TiDB Lightning は次のソースからデータを読み取ることができます。

注記：
TiDB Lightningと比較すると、 IMPORT INTOステートメントは TiDB ノード上で直接実行でき、自動化された分散タスクスケジューリングとTiDB グローバルソートをサポートし、デプロイメント、リソース使用率、タスク構成の利便性、呼び出しと統合の容易さ、高可用性、スケーラビリティが大幅に向上しています。適切なシナリオでは、 TiDB LightningではなくIMPORT INTO使用を検討することをお勧めします。

TiDB Lightningアーキテクチャ

TiDB Lightning は、 backendで設定された 2 つのインポートモードをサポートしています。インポートモードによって、データが TiDB にインポートされる方法が決まります。

物理インポートモード : TiDB Lightning は、まずデータをキーと値のペアにエンコードしてローカルの一時ディレクトリに保存し、次にこれらのキーと値のペアを各 TiKV ノードにアップロードし、最後に TiKV 取り込みインターフェイスを呼び出して TiKV の RocksDB にデータを挿入します。初期インポートを実行する必要がある場合は、インポート速度が速い物理インポートモードを検討してください。物理インポートモードのバックエンドはlocalです。
論理インポートモード : TiDB Lightning は最初にデータを SQL 文にエンコードし、次にこれらの SQL 文を直接実行してデータをインポートします。インポートするクラスターが本番にある場合、またはインポートするターゲットテーブルにすでにデータが含まれている場合は、論理インポートモードを使用します。論理インポートモードのバックエンドはtidbです。

インポートモード	物理インポートモード	論理インポートモード
バックエンド	`local`	`tidb`
スピード	高速 (100~500 GiB/時間)	低 (10~50 GiB/時間)
資源消費	高い	低い
ネットワーク帯域幅の消費	高い	低い
インポート時のACID準拠	いいえ	はい
ターゲットテーブル	空である必要があります	データを含むことができる
TiDB クラスタバージョン	= 4.0.0	全て
TiDBクラスタがインポート中にサービスを提供できるかどうか	限定サービス	はい

ノート

上記のパフォーマンスデータは、2 つのモード間のインポートパフォーマンスの違いを比較するために使用されます。実際のインポート速度は、ハードウェア構成、テーブルスキーマ、インデックスの数など、さまざまな要因によって影響を受けます。

TiDB Lightning の概要

TiDB Lightningアーキテクチャ

このページは役に立ちましたか？