TiDB Lightningコンフィグレーション

このドキュメントでは、グローバル設定とタスク設定のサンプルを提供し、コマンドラインパラメータの使用方法を説明します。サンプル設定ファイルはlightning/tidb-lightning.tomlにあります。

TiDB Lightningには「グローバル」と「タスク」という2つの設定クラスがあり、構造は互換性があります。これらの違いは、サーバーモードが有効な場合にのみ発生します。サーバーモードが無効（デフォルト）の場合、 TiDB Lightningは1つのタスクのみを実行し、グローバル設定とタスク設定の両方に同じ設定ファイルが使用されます。

TiDB Lightning （グローバル）

稲妻

`status-addr`

Web インターフェースでタスクの進行状況を表示し、Prometheus メトリックを取得し、デバッグデータを公開し、インポートタスクを送信 (サーバーモード) するための HTTP ポート。
0に設定するとポートが無効になります。

`server-mode`

サーバーモードを設定します。
デフォルト値: false
値のオプション:
- false : コマンドを実行するとすぐにインポートタスクが開始されます。
- true : コマンド実行後、 TiDB LightningはWebインターフェースでインポートタスクを送信するまで待機します。詳細については、 TiDB Lightning Webインターフェース参照してください。

`level`

例: "info"

`file`

例: "tidb-lightning.log"

`max-size`

例: 128

`max-days`

例: 28

`max-backups`

例: 14

`enable-diagnose-logs` v7.3.0 の新機能

診断ログを有効にするかどうかを制御します。
デフォルト値: false
値のオプション:
- false : インポートに関連するログのみが出力され、その他の依存コンポーネントのログは出力されません。
- true : インポートプロセスとその他の依存コンポーネントの両方からのログが出力され、診断に使用できる GRPC デバッグが有効になります。

TiDB Lightning （タスク）

稲妻

`check-requirements`

タスクを開始する前にクラスターが最小要件を満たしているかどうかを確認し、実行中に TiKV に 10% を超える空き領域が残っているかどうかを確認します。

`index-concurrency`

同時に開くインデックスエンジンの最大数。各テーブルは、インデックスを格納する1つの「インデックスエンジン」と、行データを格納する複数の「データエンジン」に分割されます。1とindex-concurrency table-concurrency設定は、各エンジンタイプの最大同時実行数を制御します。通常はデフォルト値を使用してください。

`table-concurrency`

同時に開くことができるデータエンジンの最大数です。各テーブルは、インデックスを格納する1つの「インデックスエンジン」と、行データを格納する複数の「データエンジン」に分割されます。1とindex-concurrency table-concurrency設定は、各エンジンタイプの最大同時接続数を制御します。通常はデフォルト値を使用してください。

`region-concurrency`

データの同時実行数。他のコンポーネントと一緒にデプロイする場合は、論理CPUコアのサイズの75%に設定してCPU使用率を制限できます。
デフォルト値: 論理CPUコアの数

`io-concurrency`

最大I/O同時実行数。I/O同時実行数が多すぎると、ディスクの内部バッファが頻繁に更新されるため、I/Oレイテンシーが増加し、キャッシュミスが発生し、読み取り速度が低下します。storageメディアによっては、最適なパフォーマンスを得るためにこの値を調整する必要がある場合があります。

`max-error`

TiDB Lightning を停止する前に許容される致命的ではないエラーの最大数。
致命的ではないエラーはいくつかの行に限定されており、それらの行を無視するとインポートプロセスを続行できます。
これを N に設定すると、(N+1) 番目のエラーが発生すると、 TiDB Lightning はできるだけ早く停止します。
スキップされた行は、ターゲット TiDB のtask infoスキーマ内のテーブルに挿入されます。
デフォルト値: MaxInt64バイト、つまり9223372036854775807バイト。

`task-info-schema-name`

TiDB Lightning実行結果を保存するスキーマまたはデータベースの名前を指定します。
エラー記録を無効にするには、これを空の文字列に設定します。

`meta-schema-name`

並行輸入モードでは、ターゲットクラスタ内の各TiDB Lightningインスタンスのメタ情報を格納するスキーマ名です。このパラメータは、並列インポートが有効な場合にのみ設定してください。
このパラメータに設定する値は、同じ並列インポートに参加する各TiDB Lightningインスタンスで同じである必要があります。そうでない場合、インポートされたデータの正確性は保証されません。
並列インポートモードが有効になっている場合は、インポートに使用されるユーザー (構成tidb.user ) に、この構成に対応するデータベースを作成してアクセスする権限があることを確認してください。
TiDB Lightningはインポート完了後にこのスキーマを削除します。そのため、このパラメータを設定する際に既存のスキーマ名を使用しないでください。
デフォルト値: "lightning_metadata"

安全

securityセクションでは、クラスター内の TLS 接続の証明書とキーを指定します。

`ca-path`

CA の公開証明書を指定します。TLS を無効にする場合は空白のままにしてください。

`cert-path`

このサービスの公開証明書を指定します。

`key-path`

このサービスの秘密鍵を指定します。

チェックポイント

`enable`

チェックポイントを有効にするかどうかを制御します。
データのインポート中に、 TiDB Lightning はどのテーブルがインポートされたかを記録するため、 TiDB Lightningまたは別のコンポーネントがクラッシュした場合でも、最初から再起動するのではなく、既知の正常な状態から開始できます。

`schema`

チェックポイントを保存するスキーマ名 (データベース名) を指定します。

`driver`

チェックポイントを保存する場所。
値のオプション:
- "file" : ローカルファイルとして保存します。
- "mysql" : リモートの MySQL 互換データベースに保存します。

`dsn`

チェックポイントstorageの場所を示すデータソース名 (DSN)。
fileドライバの場合、DSNはパスです。パスが指定されていない場合、 TiDB Lightningはデフォルト値の/tmp/CHECKPOINT_SCHEMA.pb使用します。
mysqlドライバーの場合、DSN はUSER:PASS@tcp(HOST:PORT)/形式の URL です。
URL が指定されていない場合は、チェックポイントの保存にセクション[tidb]の TiDBサーバーが使用されます。
ターゲット TiDB クラスターの負荷を軽減するには、別の MySQL 互換データベースサーバーを指定することをお勧めします。

`keep-after-success`

すべてのデータのインポート後もチェックポイントを保持するかどうかを制御します。1 false場合、チェックポイントは削除されます。
チェックポイントを保持するとデバッグが容易になりますが、データソースに関するメタデータが漏洩します。

対立

`strategy`

v7.3.0以降、競合データを処理するための新しい戦略が導入されました。v8.0.0以降、 TiDB Lightningは物理インポートモードと論理インポートモードの両方で競合戦略を最適化します。
デフォルト値: ""
値のオプション:
- "" :
  - 物理インポートモードでは、 TiDB Lightning は競合するデータを検出または処理しません。ソースファイルに競合する主キーまたは一意キーのレコードが含まれている場合、後続のステップでエラーが報告されます。
  - 論理インポートモードでは、 TiDB Lightning は""戦略を"error"戦略に変換して処理します。
- "error" : インポートされたデータ内で競合する主キーレコードまたは一意キーレコードが検出されると、 TiDB Lightning はインポートを終了し、エラーを報告します。
- "replace" : 競合する主キーレコードまたは一意キーレコードが発生した場合、 TiDB Lightning は最新のデータを保持し、古いデータを上書きします。
  - 物理インポートモードを使用すると、競合するデータはターゲット TiDB クラスターのlightning_task_info.conflict_viewビューに記録されます。
  - lightning_task_info.conflict_viewビューにおいて、行のis_precheck_conflictフィールドが0の場合、その行に記録されている競合データは後処理の競合検出によって検出されたことを意味します。行のis_precheck_conflictフィールドが1の場合、その行に記録されている競合データはインポート前の競合検出によって検出されたことを意味します。アプリケーション要件に応じて、適切なレコードをターゲットテーブルに手動で挿入できます。
  - ターゲット TiKV は v5.2.0 以降のバージョンである必要があることに注意してください。
- "ignore" : 主キーまたは一意キーのレコードの競合が発生した場合、 TiDB Lightning は古いデータを保持し、新しいデータを無視します。このオプションは論理インポートモードでのみ使用できます。

`precheck-conflict-before-import`

インポート前の競合検出を有効にするかどうかを制御します。これは、TiDBにインポートする前にデータの競合をチェックします。このパラメータは、物理インポートモードでのみ使用できます。
競合レコードの数が 1,000,000 を超えるシナリオでは、競合検出のパフォーマンスを向上させるためにprecheck-conflict-before-import = true設定することをお勧めします。
その他のシナリオでは、無効にすることをお勧めします。
デフォルト値: false
値のオプション:
- false : TiDB Lightning はインポート後にのみ競合をチェックします。
- true : TiDB Lightning はインポートの前後の両方で競合をチェックします。

`threshold`

strategyが"replace"または"ignore"場合に処理できる競合エラーの最大数を制御します。7 がstrategyまたは"ignore" "replace"のみ設定できます。
10000より大きい値を設定すると、インポートプロセスのパフォーマンスが低下する可能性があります。
デフォルト値: 10000

`max-record-rows`

conflict_recordsテーブル内のレコードの最大数を制御します。
v8.1.0 以降では、ユーザー入力に関係なく、 TiDB Lightning がmax-record-rows値にthresholdの値を自動的に割り当てるため、 max-record-rows手動で構成する必要はありません。
max-record-rows将来のリリースでは廃止される予定です。
物理インポートモードでは、戦略が"replace"場合、上書きされる競合レコードが記録されます。
論理インポートモードでは、戦略が"ignore"場合、無視される競合レコードが記録され、戦略が"replace"場合、競合レコードは記録されません。
デフォルト値: 10000

tikvインポーター

`backend`

TiDB Lightningのインポートモードを指定します。
デフォルト値: "local"
値のオプション:
- "local" : 物理インポートモード（デフォルト）です。これは、例えば1 TiBを超えるような大規模なデータセットのインポートに適用されます。ただし、インポート中は下流のTiDBはサービスを提供できません。
- "tidb" : 論理インポートモード。このモードは、例えば1 TiB未満の小さなデータセットのインポートに使用できます。インポート中は、下流のTiDBがサービスを提供できます。

`parallel-import`

複数のTiDB Lightningインスタンス（物理インポートモード）が1つ以上のターゲットテーブル並行してにデータをインポートできるようにするかどうかを制御します。このパラメータは、ターゲットテーブルが空の場合にのみ使用されることに注意してください。
デフォルト値: false
値falseオプション: true
並列インポートモードを使用する場合は、パラメータをtrueに設定する必要がありますが、ターゲットテーブルにデータが存在しないことが前提となります。つまり、すべてのデータはTiDB Lightningによってのみインポートできます。

`duplicate-resolution`

警告

バージョン8.0.0以降、 duplicate-resolutionパラメータは非推奨となり、将来のリリースで削除される予定です。詳細については、競合検出の旧バージョン参照してください。

物理インポートモードで重複レコード (一意キーの競合) を検出して解決するかどうかを制御します。
デフォルト値: 'none'
値のオプション:
- 'none' : 重複レコードを検出しません。データソースに重複レコードがある場合、ターゲットTiDBでデータの不整合が発生する可能性があります。2 duplicate-resolution = 'none'設定し、 conflict.strategy設定していない場合、 TiDB Lightningは自動的に""からconflict.strategy割り当てます。
- 'remove' : duplicate-resolution = 'remove'設定し、 conflict.strategy設定しない場合、 TiDB Lightning は自動的にconflict.strategyに「置換」を割り当て、新しいバージョンの競合検出を有効にします。

`send-kv-pairs`

警告

バージョン7.2.0以降、このパラメータは非推奨となり、設定後は無効になります。1回のリクエストでTiKVに送信するデータ量を調整したい場合は、代わりにsend-kv-sizeパラメータを使用してください。

物理インポートモードで TiKV にデータを送信するときに、1 つの要求内の KV ペアの最大数を指定します。

`send-kv-size` v7.2.0 の新機能

物理インポートモードで TiKV にデータを送信するときの 1 つのリクエストの最大サイズを指定します。
デフォルト値: "16K"

`compress-kv-pairs`

物理インポートモードで KV ペアを TiKV に送信するときに圧縮を有効にするかどうかを制御します。
現在、Gzip圧縮アルゴリズムのみがサポートされています。このアルゴリズムを使用するには、このパラメータに"gzip"または"gz"入力してください。
デフォルト値: "" 。圧縮が有効になっていないことを意味します。
"gz" "gzip"オプション: ""

`sorted-kv-dir`

物理インポートモードにおけるローカルKVソートのディレクトリを指定します。ディスクパフォーマンスが低い場合（HDDなど）は、インポート速度を向上させるために、 data-source-dirとは異なるディスク上のディレクトリを設定することをお勧めします。

`range-concurrency`

TiKV が物理インポートモードで KV データを書き込む同時実行性を指定します。
TiDB Lightningと TiKV 間のネットワーク伝送速度が 10 ギガビットを超える場合は、この値を適宜増やすことができます。

`store-write-bwlimit`

物理インポートモードでTiDB Lightning が各 TiKV ノードにデータを書き込む帯域幅を制限します。
Default value: 0, which means no limit.

`disk-quota`

物理インポートモードを使用する場合のローカル一時ファイルのディスククォータを指定します。
ディスククォータが不足している場合、 TiDB Lightningはソースデータの読み取りと一時ファイルの書き込みを停止しますが、ソート済みのキーと値のペアをTiKVに書き込むことを優先します。TiDB TiDB Lightningがローカルの一時ファイルを削除した後、インポートプロセスは続行されます。
このオプションは、 backendオプションをlocalに設定した場合にのみ有効になります。
デフォルト値: MaxInt64バイト、つまり 9223372036854775807 バイト。

`add-index-by-sql`

物理インポートモードで SQL 経由でインデックスを追加するかどうかを指定します。
このメカニズムは、従来のバージョンと一貫性があります。SQLを使用してインデックスを追加する利点は、データのインポートとインデックスのインポートを個別に実行できるため、データのインポートが高速化されることです。データのインポート後、インデックスの追加に失敗しても、インポートされたデータの整合性には影響しません。
デフォルト値: false
値のオプション:
- false : TiDB Lightningデータとインデックスデータの両方を KV ペアにエンコードし、一緒に TiKV にインポートします。
- true : TiDB Lightning は、行データをインポートした後、 ADD INDEX SQL ステートメントを使用してインデックスを追加します。

`keyspace-name`

TiDB Lightningを使用してマルチテナント TiDB クラスターをインポートする場合は、このパラメータを使用して対応するキースペース名を指定します。
デフォルト値: "" 。これは、 TiDB Lightning がデータをインポートするために、対応するテナントのキースペース名を自動的に取得することを意味します。
値を指定すると、指定されたキースペース名がデータのインポートに使用されます。

`pause-pd-scheduler-scope`バージョン7.1.0の新機能

物理インポートモードでは、このパラメータはTiDB Lightning がPD スケジュールを停止する範囲を制御します。
デフォルト値: "table"
値のオプション:
- "table" : ターゲットテーブルデータを格納するリージョンに対してのみスケジュールを一時停止します。
- "global" : グローバルスケジューリングを一時停止します。ビジネストラフィックのないクラスターにデータをインポートする場合は、他のスケジューリングからの干渉を避けるため、このパラメータを"global"に設定することをお勧めします。

`region-split-batch-size` v7.1.0 の新機能

物理インポートモードでは、このパラメータはバッチで領域を分割するときの領域の数を制御します。
TiDB Lightningインスタンスごとに同時に分割できるリージョンの最大数は次のとおりです: region-split-batch-size * region-split-concurrency * table-concurrency
デフォルト値: 4096

`region-split-concurrency` v7.1.0 の新機能

物理インポートモードでは、このパラメータはリージョンを分割する際の同時実行性を制御します。
デフォルト値: CPUコアの数

`region-check-backoff-limit` v7.1.0 の新機能

物理インポートモードでは、このパラメータは、分割および分散操作後にリージョンがオンラインになるまで待機する再試行回数を制御します。
再試行間隔は最大2秒です。再試行の間にいずれかのリージョンがオンラインになった場合でも、再試行回数は増加しません。
デフォルト値: 1800

`block-size` v7.6.0 の新機能

物理インポートモードにおいて、このパラメータはローカルファイルのソートに使用するI/Oブロックサイズを制御します。ディスクIOPSがボトルネックになっている場合は、この値を増やすことでデータインポートのパフォーマンスを向上させることができます。
値は1B以上である必要があります。数値のみ（例： 16 ）を指定した場合、単位は KiB ではなくバイトになります。
デフォルト値: "16KiB"

`logical-import-batch-size` v8.0.0 の新機能

論理インポートモードでは、このパラメータはダウンストリーム TiDBサーバーで実行される各 SQL ステートメントのサイズを制御します。
単一のトランザクション内のINSERTまたはREPLACEステートメントのVALUES部分の予想サイズを指定します。
このパラメータは厳密な制限ではありません。実際に実行されるSQLは、インポートされるコンテンツに応じて、これより長くなったり短くなったりする場合があります。
デフォルト値: "96KiB" 。これは、 TiDB Lightning がクラスターの唯一のクライアントである場合に、インポート速度が最適化されます。
TiDB Lightningの実装上の理由により、この値は96KiBに制限されています。これより大きな値を設定しても効果はありません。この値を下げることで、大規模なトランザクションによるクラスターへの負荷を軽減できます。

`logical-import-batch-rows` v8.0.0 の新機能

論理インポートモードでは、このパラメータはトランザクションごとに挿入される行の最大数を制御します。
logical-import-batch-sizeとlogical-import-batch-rows両方を指定した場合、最初にしきい値に達したパラメータが有効になります。
この値を減らすと、大規模なトランザクションによるクラスターのストレスを軽減できます。
デフォルト値: 65536

`logical-import-prep-stmt`

論理インポートモードでは、このパラメータはパフォーマンスを向上させるために準備された文およびステートメントキャッシュを使用するかどうかを制御します。
デフォルト値: false

マイダンパー

`read-block-size`

ファイル読み取り時のブロックサイズを指定します。データソースの最長文字列よりも長くしてください。
デフォルト値: "64KiB"

`batch-import-ratio`

エンジンファイルは順次インポートする必要があります。並列処理のため、複数のデータエンジンがほぼ同時にインポートされ、キューが生成されてリソースが浪費されます。そのため、 TiDB Lightning、リソースを適切に配分するために、最初の数バッチのサイズをわずかに大きくしています。
スケールアップ係数はこのパラメータによって制御されます。このパラメータは、完全な同時実行における「インポート」ステップと「書き込み」ステップの所要時間の比率を表します。これは、約1GiBの単一テーブルにおける比率（インポート所要時間/書き込み所要時間）を使用して計算できます。正確な時間はログで確認できます。
「インポート」の方が高速であれば、バッチサイズの分散は小さくなり、比率が 0 であればバッチサイズは均一になります。
範囲: [0, 1)

`data-source-dir`

ローカルソースデータディレクトリまたは外部storageのURIを指定します。外部storageのURIの詳細については、 URI形式参照してください。

`character-set`

CREATE TABLEステートメントを含むスキーマファイルの文字セットを指定します。
デフォルト値: "auto"
値のオプション:
- "auto" : スキーマがUTF-8かGB-18030かを自動的に検出します。どちらでもないエンコーディングの場合はエラーが報告されます。
- "utf8mb4" : スキーマファイルは UTF-8 としてエンコードする必要があります。それ以外の場合はエラーが報告されます。
- "gb18030" : スキーマファイルは GB-18030 としてエンコードされている必要があります。そうでない場合はエラーが報告されます。
- "latin1" : スキーマファイルは、コードページ 1252 とも呼ばれる MySQL latin1 エンコードを使用します。
- "binary" : スキーマファイルのデコードを試みない

`data-character-set`

ソースデータファイルの文字セットを指定します。TiDB TiDB Lightning は、インポート時にソースファイルを指定された文字セットから UTF-8 エンコードに変換します。
現在、この設定ではCSVファイルの文字セットのみを指定し、以下のオプションがサポートされています。空白のままにすると、デフォルト値の"binary"使用され、Lightningはエンコーディングを変換しません。
TiDB Lightning はソースデータファイルの文字セットについては予測せず、この構成に基づいてソースファイルを変換し、データをインポートするだけです。
この構成の値がソースデータファイルの実際のエンコードと同じでない場合、インポートの失敗、データの損失、またはデータの乱れが発生する可能性があります。
デフォルト値: "binary"
値のオプション:
- "binary" : TiDB Lightning がエンコーディングを変換しないことを示します (デフォルト)。
- "utf8mb4" : ソースデータファイルが UTF-8 エンコードを使用していることを示します。
- "GB18030" : ソースデータファイルで GB-18030 エンコードが使用されていることを示します。
- "GBK" : ソースデータファイルは GBK エンコードを使用します (GBK エンコードは GB-2312 文字セットの拡張であり、コードページ 936 とも呼ばれます)。
- "latin1" : ソースデータファイルは、コードページ 1252 とも呼ばれる MySQL latin1 エンコードを使用します。

`data-invalid-char-replace`

ソースデータファイルの文字セット変換中に互換性のない文字があった場合に置換する文字を指定します。
この設定は、フィールド区切り文字、引用符定義子、改行文字と重複して使用しないでください。デフォルト値を変更すると、ソースデータファイルの解析パフォーマンスが低下する可能性があります。
Default value: "\uFFFD", which is the "error" Rune or Unicode replacement character in UTF-8 encoding.

`strict-format`

処理を高速化するには、入力データを厳格な形式で指定します。デフォルト値は、速度ではなく安全性を優先するfalseです。
デフォルト値: false
値falseオプション: true
strict-format = trueには次の要件があります:
- CSV では、引用符で囲まれている場合でも、すべての値にリテラルの改行 ( U+000AとU+000D 、または\rと\n ) を含めることはできません。つまり、改行は行を区切るために厳密に使用されます。
- 厳密なフォーマットにより、 TiDB Lightningは並列処理において大規模ファイルの分割位置を迅速に特定できます。ただし、入力データが「厳密」でない場合、有効なデータが半分に分割され、結果が破損する可能性があります。

`max-region-size`

strict-formatがtrueの場合、 TiDB Lightning は大きな CSV ファイルを複数のチャンクに分割して並列処理します。5 max-region-size分割後の各チャンクの最大サイズです。
デフォルト値: "256MiB"

`filter`

これらのワイルドカードルールに一致するテーブルのみをインポートします。

マイダンパー.csv

CSV ファイルの解析方法を構成します。

`separator`

フィールド間の区切り文字を指定します。1文字以上をサポートします。
デフォルト値: ','

`delimiter`

引用符の区切り文字を指定します。値が空の場合は引用符は使用されません。
デフォルト値: '"'

`terminator`

行末記号を指定します。
デフォルト値: "" 。これは、 "\n" (LF) と"\r\n" (CRLF) の両方が行末文字であることを意味します。

`header`

CSV ファイルにヘッダーが含まれているかどうかを制御します。
値のオプション:
- true : TiDB Lightning は最初の行をテーブルヘッダーとして扱い、データとしてインポートしません。
- false : 最初の行も CSV データとしてインポートされます。

`header-schema-match`

CSV ファイルヘッダー内の列名が、ターゲットテーブルで定義された列名と一致するかどうかを制御します。
デフォルト値はtrueです。これは、CSV ヘッダーの列名がターゲットテーブルの列名と一致していることが確認されたことを意味します。そのため、2 つの列の順序が異なっていても、 TiDB Lightning は列名をマッピングすることでデータを正常にインポートできます。
CSVテーブルヘッダーとターゲットテーブルの列名が一致しない（例えば、CSVテーブルヘッダーの一部の列名がターゲットテーブルに見つからない）ものの、列の順序が同じ場合は、この設定をfalseに設定してください。この場合、 TiDB Lightningはエラーを回避するためにCSVヘッダーを無視し、ターゲットテーブルの列の順序でデータを直接インポートします。したがって、列の順序が同じでない場合は、インポート前にCSVファイル内の列の順序をターゲットテーブルの順序と一致するように手動で調整する必要があります。そうしないと、データの不一致が発生する可能性があります。
デフォルト値: true
値falseオプション: true

注記：
このパラメータは、 headerパラメータがtrueに設定されている場合にのみ適用されます。5 header falseに設定されている場合は、CSVファイルにヘッダーが含まれていないため、このパラメータは適用されません。

`not-null`

CSV に NULL 値が含まれているかどうかを制御します。
値のオプション:
- true : CSV のすべての列を NULL にすることはできません。
- false : CSV には NULL 値を含めることができます。

`null`

not-nullがfalse場合 (つまり、CSV に NULL を含めることができる場合)、この値に等しいフィールドは NULL として扱われます。

`backslash-escape`

フィールド内のバックスラッシュエスケープを解釈するかどうかを制御します。

`trim-last-separator`

行がセパレーターで終わる場合にそれを削除するかどうかを制御します。

mydumper.files

`pattern`

AWS Aurora parquet ファイルを解析するために使用される式。
例: '(?i)^(?:[^/]*/)*([a-z0-9_]+)\.([a-z0-9_]+)/(?:[^/]*/)*(?:[a-z0-9\-_.]+\.(parquet))$'

`schema`

例: '$1'

`table`

例: '$2'

`type`

例: '$3'

ティッド

`host`

クラスターからの任意の TiDBサーバーのコンフィグレーション。

`port`

例: 4000

`user`

例: "root"

`password`

TiDBに接続するためのパスワードを設定します。パスワードはプレーンテキストまたはBase64エンコードのいずれかで使用できます。

`status-port`

TiDB からテーブルスキーマ情報を取得します。

`pd-addr`

クラスター内の任意のPDサーバーのアドレスを指定します。v7.6.0以降、TiDBは複数のPDアドレスの設定をサポートします。

`log-level`

TiDB ライブラリのログレベルを制御します。TiDB TiDB Lightning はTiDB をライブラリとしてインポートし、いくつかのログを自ら生成します。

`build-stats-concurrency`

チェックサムおよび分析処理を高速化するために、TiDBセッション変数を設定します。詳細については、 ANALYZE同時実行を制御する参照してください。

`distsql-scan-concurrency`

チェックサムおよび分析処理を高速化するために、TiDBセッション変数を設定します。詳細については、 ANALYZE同時実行を制御する参照してください。
checksum-via-sql "true"に設定すると、 TiDB Lightning はADMIN CHECKSUM TABLE <table> SQL 文を実行して TiDB のチェックサム演算を実行します。この場合、後続のパラメータdistsql-scan-concurrencyとchecksum-table-concurrency有効になりません。

`index-serial-scan-concurrency`

チェックサムおよび分析処理を高速化するために、TiDBセッション変数を設定します。詳細については、 ANALYZE同時実行を制御する参照してください。

`checksum-table-concurrency`

チェックサムとANALYZE操作を高速化するために、TiDBセッション変数を設定します。詳細については、 ANALYZE同時実行を制御する参照してください。
checksum-via-sql "true"に設定すると、 TiDB Lightning はADMIN CHECKSUM TABLE <table> SQL 文を実行して TiDB のチェックサム演算を実行します。この場合、後続のパラメータdistsql-scan-concurrencyとchecksum-table-concurrency有効になりません。

`sql-mode`

SQL ステートメントを解析および実行するために使用するデフォルトの SQL モードを指定します。

`max-allowed-packet`

SQL 接続に許可される最大パケットサイズを設定します。
これを0に設定すると、接続ごとにサーバーからmax_allowed_packet変数が自動的に取得されます。

`tls`

SQL 接続に TLS を使用するかどうかを制御します。
値のオプション:
- "" : [tidb.security]セクションが設定されている場合は TLS を強制します（「cluster」と同じ）。それ以外の場合は"false"と同じです。
- "false" : TLS を無効にします。
- "cluster" : TLS を強制し、 [tidb.security]セクションで指定された CA を使用してサーバーの証明書を検証します。
- "skip-verify" : TLSを強制しますが、サーバーの証明書は検証しません。この設定は安全ではないことに注意してください。
- "preferred" : "skip-verify"と同じですが、サーバーがTLS をサポートしていない場合は、暗号化されていない接続にフォールバックします。

tidb.セキュリティ

TLS 対応の MySQL 接続用の証明書とキーを指定します。
デフォルト値: securityセクションのコピー。

`ca-path`

CA の公開証明書を指定します。SQL の TLS を無効にする場合は、空の文字列に設定します。

`cert-path`

このサービスの公開証明書を指定します。
デフォルト値: security.cert-pathのコピー。

`key-path`

このサービスの秘密鍵を指定します。
デフォルト値: security.key-pathのコピー。

tidb.セッション変数

その他の TiDB セッション変数を指定します。

復元後

物理インポートモードでは、データのインポートが完了すると、 TiDB Lightning はチェックサムとANALYZE操作を自動的に実行できます。
本番環境ではこれらを true のままにしておくことをお勧めします。
実行順序: チェックサム -> ANALYZE 。
論理インポートモードでは、チェックサムとANALYZE操作は必要なく、実際の操作では常にスキップされることに注意してください。

`checksum`

インポート後にデータの整合性を検証するために、テーブルごとにADMIN CHECKSUM TABLE <table>実行するかどうかを指定します。
デフォルト値: "required" 。v4.0.8 以降では、デフォルト値は"true"から"required"に変更されます。
値のオプション:
- "required" : 管理者チェックサムを実行します。チェックサムが失敗した場合、 TiDB Lightning は失敗して終了します。
- "optional" : 管理者チェックサムを実行します。チェックサムが失敗した場合、 TiDB Lightning はWARN ログを報告しますが、エラーは無視されます。
- "off" : チェックサムを実行しません。
チェックサムの失敗は通常、インポート例外（データの損失または不整合）を意味します。チェックサムは常に有効にすることをお勧めします。
下位互換性のため、このフィールドでは bool 値trueとfalseも許可されます。5 true requiredに相当し、 false offに相当します。

`checksum-via-sql`

ADMIN CHECKSUM TABLE <table>操作が TiDB 経由で実行されるかどうかを指定します。
デフォルト値: "false"
値のオプション:
- "false" : ADMIN CHECKSUM TABLE <table>コマンドはTiDB Lightning経由で実行するために TiKV に送信されます。
- "true" : この値が"true"場合に同時実行性を調整するには、TiDB でtidb_checksum_table_concurrency変数を設定する必要があります。
チェックサムが失敗した場合に問題を特定しやすくするために、この値を"true"に設定することをお勧めします。

`analyze`

チェックサムが完了した後、各テーブルに対してANALYZE TABLE <table>実行するかどうかを指定します。
デフォルト値: "optional"
"off" "optional"オプション: "required"

クローン

バックグラウンドでの定期的なアクションを設定します。
サポートされる単位: h (時間)、m (分)、s (秒)。

`switch-mode`

TiDB Lightningがインポートモードのステータスを自動的に更新する間隔を指定します。対応するTiKV設定よりも短くする必要があります。

`log-progress`

インポートの進行状況をログに出力する間隔を指定します。

`check-disk-quota`

物理インポートモードを使用するときに、ローカルディスククォータをチェックする時間間隔を指定します。
デフォルト値: "60s" 、つまり 60 秒です。

TiDB Lightningコンフィグレーション

TiDB Lightning （グローバル）

稲妻

status-addr

server-mode

level

file

max-size

max-days

max-backups

enable-diagnose-logs v7.3.0 の新機能

TiDB Lightning （タスク）

稲妻

check-requirements

index-concurrency

table-concurrency

region-concurrency

io-concurrency

max-error

task-info-schema-name

meta-schema-name

安全

ca-path

cert-path

key-path

チェックポイント

enable

schema

driver

dsn

keep-after-success

対立

strategy

precheck-conflict-before-import

threshold

max-record-rows

tikvインポーター

backend

parallel-import

duplicate-resolution

send-kv-pairs

send-kv-size v7.2.0 の新機能

compress-kv-pairs

sorted-kv-dir

range-concurrency

store-write-bwlimit

disk-quota

add-index-by-sql

keyspace-name

pause-pd-scheduler-scopeバージョン7.1.0の新機能

region-split-batch-size v7.1.0 の新機能

region-split-concurrency v7.1.0 の新機能

region-check-backoff-limit v7.1.0 の新機能

block-size v7.6.0 の新機能

logical-import-batch-size v8.0.0 の新機能

logical-import-batch-rows v8.0.0 の新機能

logical-import-prep-stmt

マイダンパー

read-block-size

batch-import-ratio

data-source-dir

character-set

data-character-set

data-invalid-char-replace

strict-format

max-region-size

filter

マイダンパー.csv

separator

delimiter

terminator

header

header-schema-match

not-null

null

backslash-escape

trim-last-separator

mydumper.files

pattern

schema

`status-addr`

`server-mode`

`level`

`file`

`max-size`

`max-days`

`max-backups`

`enable-diagnose-logs` v7.3.0 の新機能

`check-requirements`

`index-concurrency`

`table-concurrency`

`region-concurrency`

`io-concurrency`

`max-error`

`task-info-schema-name`

`meta-schema-name`

`ca-path`

`cert-path`

`key-path`

`enable`

`schema`

`driver`

`dsn`

`keep-after-success`

`strategy`

`precheck-conflict-before-import`

`threshold`

`max-record-rows`

`backend`

`parallel-import`

`duplicate-resolution`

`send-kv-pairs`

`send-kv-size` v7.2.0 の新機能

`compress-kv-pairs`

`sorted-kv-dir`

`range-concurrency`

`store-write-bwlimit`

`disk-quota`

`add-index-by-sql`

`keyspace-name`

`pause-pd-scheduler-scope`バージョン7.1.0の新機能

`region-split-batch-size` v7.1.0 の新機能

`region-split-concurrency` v7.1.0 の新機能

`region-check-backoff-limit` v7.1.0 の新機能

`block-size` v7.6.0 の新機能

`logical-import-batch-size` v8.0.0 の新機能

`logical-import-batch-rows` v8.0.0 の新機能

`logical-import-prep-stmt`

`read-block-size`

`batch-import-ratio`

`data-source-dir`

`character-set`

`data-character-set`

`data-invalid-char-replace`

`strict-format`

`max-region-size`

`filter`

`separator`

`delimiter`

`terminator`

`header`

`header-schema-match`

`not-null`

`null`

`backslash-escape`

`trim-last-separator`

`pattern`

`schema`

`table`

`type`

`host`

`port`

`user`

`password`

`status-port`

`pd-addr`

`log-level`

`build-stats-concurrency`

`distsql-scan-concurrency`

`index-serial-scan-concurrency`