TiDB Lightningのトラブルシューティング

このドキュメントでは、 TiDB Lightning を使用するときに発生する可能性のある一般的な問題とその解決策を要約します。

インポート速度が遅すぎる

通常、 TiDB Lightningが 256 MB データファイルをインポートするには、スレッドごとに 2 分かかります。速度がこれより大幅に遅い場合は、エラーが発生します。各データファイルにかかった時間は、 restore chunk … takesのログから確認できます。これは、Grafana のメトリクスからも観察できます。

TiDB Lightning が遅くなる理由はいくつかあります。

原因 1 : region-concurrencyの設定が高すぎるため、スレッドの競合が発生し、パフォーマンスが低下します。

設定は、ログの先頭から検索region-concurrencyで見つけることができます。
TiDB Lightning が他のサービス (TiKV Importer など) と同じマシンを共有する場合、CPU コアの総数の 75% にregion-concurrencyを手動で設定する必要があります。
CPU にクォータがある場合 (たとえば、Kubernetes 設定によって制限されている場合)、 TiDB Lightning はこれを読み取れない可能性があります。この場合、手動でregion-concurrencyを減らす必要もあります。

原因 2 : テーブルスキーマが複雑すぎます。

インデックスを追加するたびに、行ごとに新しい KV ペアが導入されます。 N 個のインデックスがある場合、インポートされる実際のサイズは、 Dumpling出力のサイズの約 (N+1) 倍になります。インデックスが無視できる場合は、まずスキーマからインデックスを削除し、インポートが完了した後にCREATE INDEXを使用して追加し直すことができます。

原因3 ：各ファイルが大きすぎます。

TiDB Lightning は、データを並行して処理できるように、データソースがサイズ約 256 MB の複数のファイルに分割されている場合に最適に機能します。各ファイルが大きすぎる場合、 TiDB Lightning が応答しない可能性があります。

データソースが CSV で、すべての CSV ファイルに改行制御文字 (U+000A および U+000D) を含むフィールドがない場合、「厳密な形式」をオンにして、 TiDB Lightning が大きなファイルを自動的に分割できるようにすることができます。

[mydumper]
strict-format = true

原因 4 : TiDB Lightning が古すぎます。

最新バージョンをお試しください。もしかしたら新たな速度向上があるかもしれません。

`tidb-lightning`プロセスがバックグラウンドで実行中に突然終了する

これは、 tidb-lightning間違って開始したことが原因である可能性があり、そのためシステムが SIGHUP シグナルを送信してtidb-lightningプロセスを停止させます。この状況では、通常、 tidb-lightning.log次のログを出力します。

[2018/08/10 07:29:08.310 +08:00] [INFO] [main.go:41] ["got signal to exit"] [signal=hangup]

コマンドラインでnohup直接使用してtidb-lightningを開始することはお勧めできません。 tidb-lightningを開始するスクリプトを実行することで実行できます。

さらに、 TiDB Lightningの最後のログでエラーが「コンテキストがキャンセルされました」であることが示されている場合は、最初の「ERROR」レベルのログを検索する必要があります。通常、この「ERROR」レベルのログの後には「終了する信号を取得しました」というメッセージが続きます。これは、 TiDB Lightning が割り込み信号を受信して終了したことを示します。

TiDB クラスターは大量の CPU リソースを使用し、 TiDB Lightningを使用した後は動作が非常に遅くなります。

tidb-lightningが異常終了した場合、クラスターは本番には適さない「インポートモード」でスタックする可能性があります。現在のモードは、次のコマンドを使用して取得できます。

tidb-lightning-ctl --config tidb-lightning.toml --fetch-mode

次のコマンドを使用して、クラスターを強制的に「通常モード」に戻すことができます。

tidb-lightning-ctl --config tidb-lightning.toml --fetch-mode

TiDB Lightning がエラーを報告する

`could not find first pair, this shouldn't happen`

このエラーは、 TiDB Lightningがソートされたローカルファイルを読み取るときに、 TiDB Lightningによって開かれたファイルの数がシステム制限を超えたために発生する可能性があります。 Linux システムでは、 ulimit -nコマンドを使用して、このシステム制限の値が小さすぎるかどうかを確認できます。インポート中にこの値を1000000 ( ulimit -n 1000000 ) に調整することをお勧めします。

`checksum failed: checksum mismatched remote vs local`

原因: ローカルデータソースとリモートインポートされたデータベースのテーブルのチェックサムが異なります。このエラーにはいくつかの深い理由があります。 checksum mismatchedを含むログを確認すると、さらに原因を特定できます。

checksum mismatchedを含む行は情報total_kvs: x vs y提供します。ここで、 xインポート完了後にターゲットクラスターによって計算されたキーと値のペア (KV ペア) の数を示し、 yローカルデータによって生成されたキーと値のペアの数を示します。ソース。

xが大きい場合は、ターゲットクラスター内により多くの KV ペアが存在することを意味します。
- インポート前にこのテーブルが空ではない可能性があり、そのためデータのチェックサムに影響を与えます。 TiDB Lightning が以前に失敗してシャットダウンしたが、正しく再起動されなかった可能性もあります。
yが大きい場合は、ローカルデータソースに多くの KV ペアがあることを意味します。
- ターゲットデータベースのチェックサムがすべて 0 の場合は、インポートが行われていないことを意味します。クラスターがビジー状態でデータを受信できない可能性があります。
- エクスポートされたデータには、重複した値を持つ UNIQUE キーと PRIMARY KEY などの重複データが含まれているか、データは大文字と小文字が区別されるが、ダウンストリームテーブル構造では大文字と小文字が区別されない可能性があります。
その他考えられる理由
- データソースが機械生成され、 Dumplingによってバックアップされていない場合は、データがテーブルの制限に準拠していることを確認してください。たとえば、AUTO_INCREMENT 列は 0 ではなく、正の値である必要があります。

解決策:

tidb-lightning-ctlを使用して破損したデータを削除し、テーブル構造とデータを確認して、 TiDB Lightningを再起動して影響を受けるテーブルを再度インポートします。
```
tidb-lightning-ctl --config conf/tidb-lightning.toml --checkpoint-error-destroy=all
```
ターゲットデータベースの負荷を軽減するために、外部データベースを使用してチェックポイント (変更[checkpoint] dsn ) を保存することを検討してください。
TiDB Lightning が不適切に再起動された場合は、 FAQの「 TiDB Lightning を適切に再起動する方法」セクションも参照してください。

`Checkpoint for … has invalid status:` (エラーコード)

原因: チェックポイントが有効になっており、 TiDB Lightningまたは TiKV Importer が以前に異常終了しました。偶発的なデータ破損を防ぐため、エラーが解決されるまでTiDB Lightning は起動しません。

エラーコードは 25 より小さい整数で、取り得る値は 0、3、6、9、12、14、15、17、18、20、および 21 です。整数は、インポートで予期しない終了が発生したステップを示します。プロセス。整数が大きいほど、終了は後のステップで発生します。

解決策:

エラーの原因が無効なデータソースである場合は、 tidb-lightning-ctl使用してインポートされたデータを削除し、Lightning を再起動します。

tidb-lightning-ctl --config conf/tidb-lightning.toml --checkpoint-error-destroy=all

他のオプションについては、チェックポイント制御セクションを参照してください。

`ResourceTemporarilyUnavailable("Too many open engines …: …")`

原因: 同時エンジンファイルの数がtikv-importerで指定された制限を超えています。これは構成ミスが原因である可能性があります。さらに、 tidb-lightning異常終了した場合、エンジンファイルがダングリングオープン状態のままになる可能性があり、これもこのエラーの原因となる可能性があります。

解決策:

tikv-importer.tomlのmax-open-engines設定の値を増やします。通常、この値は使用可能なメモリによって決まります。これは次を使用して計算できます。
最大メモリ使用量 ≈ max-open-engines × write-buffer-size × max-write-buffer-number
table-concurrency + index-concurrencyの値をmax-open-engines未満になるように減らします。
tikv-importerを再起動して、すべてのエンジンファイルを強制的に削除します (デフォルトは./data.import/ )。これにより、部分的にインポートされたテーブルもすべて削除されるため、 TiDB Lightning で古いチェックポイントをクリアする必要があります。
```
tidb-lightning-ctl --config conf/tidb-lightning.toml --checkpoint-error-destroy=all
```

`cannot guess encoding for input file, please convert to UTF-8 manually`

原因: TiDB Lightning は、テーブルスキーマの UTF-8 および GB-18030 エンコーディングのみを認識します。このエラーは、ファイルがこれらのエンコーディングのいずれでもない場合に発生します。過去ALTER TABLEの実行により、ファイルに UTF-8 の文字列と GB-18030 の別の文字列が含まれるなど、エンコーディングが混在している可能性もあります。

解決策:

ファイル全体が UTF-8 または GB-18030 になるようにスキーマを修正してください。
ターゲットデータベース内の影響を受けるテーブルを手動でCREATEます。
チェックをスキップするには[mydumper] character-set = "binary"を設定します。これにより、ターゲットデータベースに mojibake が導入される可能性があることに注意してください。

`[sql2kv] sql encode error = [types:1292]invalid time format: '{1970 1 1 …}'`

原因: テーブルにtimestampタイプの列が含まれていますが、時刻値自体が存在しません。これは、DST の変更または時刻値がサポートされている範囲 (1970 年 1 月 1 日から 2038 年 1 月 19 日) を超えているためです。

解決策:

TiDB Lightningとソースデータベースが同じタイムゾーンを使用していることを確認します。
TiDB Lightningを直接実行する場合、 $TZ環境変数を使用してタイムゾーンを強制できます。
```
# Manual deployment, and force Asia/Shanghai.
TZ='Asia/Shanghai' bin/tidb-lightning -config tidb-lightning.toml
```
Mydumper を使用してデータをエクスポートする場合は、必ず--skip-tz-utcフラグを含めてください。
クラスター全体が同じ最新バージョンtzdata (バージョン 2018i 以降) を使用していることを確認します。
CentOS では、 yum info tzdataを実行して、インストールされているバージョンとアップデートがあるかどうかを確認します。 yum upgrade tzdataを実行してパッケージをアップグレードします。

`[Error 8025: entry too large, the max entry size is 6291456]`

原因: TiDB Lightningによって生成された 1 行のキーと値のペアが、TiDB によって設定された制限を超えています。

解決：

現時点では、TiDB の制限を回避することはできません。他のテーブルを正常にインポートするには、このテーブルを無視する必要があります。

TiDB Lightning がモードを切り替えるときに`rpc error: code = Unimplemented ...`

原因: クラスター内の一部のノードはswitch-modeをサポートしていません。たとえば、 TiFlash のバージョンがv4.0.0-rc.2より前の場合は、 switch-modeサポートされていません。

解決策:

クラスター内にTiFlashノードがある場合は、クラスターをv4.0.0-rc.2以降のバージョンに更新できます。
クラスターをアップグレードしたくない場合は、 TiFlash を一時的に無効にします。

`tidb lightning encountered error: TiDB version too old, expected '>=4.0.0', found '3.0.18'`

TiDB Lightning Local バックエンドは、v4.0.0 以降のバージョンの TiDB クラスターへのデータのインポートのみをサポートします。 Local-backend を使用して v2.x または v3.x クラスターにデータをインポートしようとすると、上記のエラーが報告されます。現時点では、データのインポートにインポーターバックエンドまたは TiDB バックエンドを使用するように構成を変更できます。

一部のnightlyバージョンは v4.0.0-beta.2 に似ている可能性があります。 TiDB Lightningのこれらnightlyのバージョンは、実際にローカルバックエンドをサポートしています。バージョンnightlyの使用時にこのエラーが発生した場合は、構成check-requirements = falseを設定することでバージョンチェックをスキップできます。このパラメータを設定する前に、 TiDB Lightningの設定が対応するバージョンをサポートしていることを確認してください。そうしないと、インポートが失敗する可能性があります。

`restore table test.district failed: unknown columns in header [...]`

このエラーは通常、CSV データファイルにヘッダーが含まれていないために発生します (最初の行は列名ではなくデータです)。したがって、次の設定をTiDB Lightning設定ファイルに追加する必要があります。

[mydumper.csv]
header = false

`Unknown character set`

TiDB は、すべての MySQL 文字セットをサポートしているわけではありません。したがって、インポート中にテーブルスキーマを作成するときにサポートされていない文字セットが使用された場合、 TiDB Lightning はこのエラーを報告します。このエラーを回避するには、特定のデータに応じてTiDB がサポートする文字セット使用してダウンストリームにテーブルスキーマを事前に作成します。

`invalid compression type ...`

TiDB Lightning v6.4.0 以降のバージョンは、圧縮データファイルgzip 、 snappy 、およびzstdのみをサポートします。他の種類の圧縮ファイルではエラーが発生します。ソースデータファイルが保存されているディレクトリにサポートされていない圧縮ファイルが存在する場合、タスクはエラーを報告します。このようなエラーを回避するには、サポートされていないファイルをインポートデータディレクトリから移動します。詳細については、圧縮ファイルを参照してください。

注記：
Snappy 圧縮ファイルは公式の Snappy フォーマットに存在する必要があります。 Snappy 圧縮の他のバリアントはサポートされていません。

TiDB Lightningのトラブルシューティング

インポート速度が遅すぎる

tidb-lightningプロセスがバックグラウンドで実行中に突然終了する

TiDB クラスターは大量の CPU リソースを使用し、 TiDB Lightningを使用した後は動作が非常に遅くなります。

TiDB Lightning がエラーを報告する

could not find first pair, this shouldn't happen

checksum failed: checksum mismatched remote vs local

Checkpoint for … has invalid status: (エラー コード)

ResourceTemporarilyUnavailable("Too many open engines …: …")

cannot guess encoding for input file, please convert to UTF-8 manually

[sql2kv] sql encode error = [types:1292]invalid time format: '{1970 1 1 …}'

[Error 8025: entry too large, the max entry size is 6291456]

TiDB Lightning がモードを切り替えるときにrpc error: code = Unimplemented ...

tidb lightning encountered error: TiDB version too old, expected '>=4.0.0', found '3.0.18'

restore table test.district failed: unknown columns in header [...]

Unknown character set

invalid compression type ...

このページは役に立ちましたか？

`tidb-lightning`プロセスがバックグラウンドで実行中に突然終了する

`could not find first pair, this shouldn't happen`

`checksum failed: checksum mismatched remote vs local`

`Checkpoint for … has invalid status:` (エラーコード)

`ResourceTemporarilyUnavailable("Too many open engines …: …")`

`cannot guess encoding for input file, please convert to UTF-8 manually`

`[sql2kv] sql encode error = [types:1292]invalid time format: '{1970 1 1 …}'`

`[Error 8025: entry too large, the max entry size is 6291456]`

TiDB Lightning がモードを切り替えるときに`rpc error: code = Unimplemented ...`

`tidb lightning encountered error: TiDB version too old, expected '>=4.0.0', found '3.0.18'`

`restore table test.district failed: unknown columns in header [...]`

`Unknown character set`

`invalid compression type ...`