データとインデックス間の不一致のトラブルシューティング

TiDB は、トランザクションまたはADMIN CHECK [TABLE|INDEX]のステートメントを実行するときに、データとインデックスの間の整合性をチェックします。チェックにより、レコードのキー値と対応するインデックスのキー値が矛盾していることが判明した場合、つまり、行データを格納するキーと値のペアとそのインデックスを格納する対応するキーと値のペアが矛盾している場合 (たとえば、より多くのインデックスまたはインデックスが見つからない)、TiDB はデータの不整合エラーを報告し、関連するエラーをエラー ログに出力します。

このドキュメントでは、データ不整合エラーの意味について説明し、整合性チェックをバイパスするいくつかの方法を提供します。データ整合性エラーが発生した場合は、PingCAP テクニカル サポートに連絡してトラブルシューティングを依頼してください。

エラーの説明

データとインデックスの間で不整合が発生した場合、TiDB エラー メッセージをチェックして、行データとインデックス データの間でどの項目が不整合であるかを確認したり、関連するエラー ログをチェックしてさらに調査したりできます。

トランザクション実行中に報告されたエラー

このセクションでは、TiDB がトランザクションを実行するときに報告されるデータ不整合エラーをリストし、これらのエラーの意味を例を挙げて説明します。

エラー 8133

ERROR 8133 (HY000): data inconsistency in table: t, index: k2, index-count:1 != record-count:0

このエラーは、テーブルtk2インデックスについて、テーブル内のインデックスの数が 1 で、行レコードの数が 0 であることを示しています。数が矛盾しています。

エラー 8138

ERROR 8138 (HY000): writing inconsistent data in table: t, expected-values:{KindString green} != record-values:{KindString GREEN}

このエラーは、トランザクションが誤った行の値を書き込もうとしたことを示しています。書き込まれるデータについては、エンコードおよびデコード処理の問題により、エンコードされた行データがエンコード前の元のデータと一致しません。

エラー 8139

ERROR 8139 (HY000): writing inconsistent data in table: t, index: i1, index-handle:4 != record-handle:3, index: tables.mutation{key:kv.Key{0x74, 0x80, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x49, 0x5f, 0x69, 0x80, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x1, 0x1, 0x68, 0x65, 0x6c, 0x6c, 0x6f, 0x0, 0x0, 0x0, 0xfc, 0x1, 0x68, 0x65, 0x6c, 0x6c, 0x6f, 0x0, 0x0, 0x0, 0xfc, 0x3, 0x80, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x4}, flags:0x0, value:[]uint8{0x30}, indexID:1}, record: tables.mutation{key:kv.Key{0x74, 0x80, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x49, 0x5f, 0x72, 0x80, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x3}, flags:0xd, value:[]uint8{0x80, 0x0, 0x2, 0x0, 0x0, 0x0, 0x1, 0x2, 0x5, 0x0, 0xa, 0x0, 0x68, 0x65, 0x6c, 0x6c, 0x6f, 0x68, 0x65, 0x6c, 0x6c, 0x6f}, indexID:0}

このエラーは、書き込むデータのハンドル (つまり、行データのキー) が一致していないことを示しています。テーブルtのインデックスi1の場合、トランザクションによって書き込まれる行には、インデックスのキーと値のペアに 4 のハンドルがあり、行レコードのキーと値のペアに 3 のハンドルがあります。この行のデータは書き込まれません。

エラー 8140

ERROR 8140 (HY000): writing inconsistent data in table: t, index: i2, col: c1, indexed-value:{KindString hellp} != record-value:{KindString hello}

このエラーは、トランザクションによって書き込まれる行のデータがインデックスのデータと一致しないことを示しています。テーブルtのインデックスi2の場合、トランザクションによって書き込まれる行には、インデックスのキーと値のペアにデータhellpがあり、レコードのキーと値のペアにデータhelloがあります。この行のデータは書き込まれません。

エラー 8141

ERROR 8141 (HY000): assertion failed: key: 7480000000000000405f72013300000000000000f8, assertion: NotExist, start_ts: 430590532931813377, existing start ts: 430590532931551233, existing commit ts: 430590532931551234

このエラーは、トランザクションのコミット中にアサーションが失敗したことを示しています。データとインデックスが一致していると仮定すると、TiDB はキー7480000000000000405f720133000000000000000000f8が存在しないと主張しました。トランザクションがコミットされたとき、TiDB はstart ts 430590532931551233のトランザクションによって書き込まれたキーが存在することを発見しました。 TiDB は、このキーの Multi-Version Concurrency Control (MVCC) 履歴をログに出力します。

管理チェックで報告されたエラー

このセクションでは、 ADMIN CHECK [TABLE|INDEX]ステートメントを実行したときに TiDB で発生する可能性のあるデータ不整合エラーをリストし、これらのエラーの意味を例を挙げて説明します。

エラー 8003

ERROR 8003 (HY000): table count 3 != index(idx) count 2

このエラーは、 ADMIN CHECKステートメントが実行されたテーブルに 3 つの行のキーと値のペアがあり、インデックスのキーと値のペアが 2 つしかないことを示しています。

エラー 8134

ERROR 8134 (HY000): data inconsistency in table: t, index: c2, col: c2, handle: "2", index-values:"KindInt64 13" != record-values:"KindInt64 12", compare err:<nil>

このエラーは、テーブルtのインデックスc2の行のハンドルが、インデックスのキーと値のペアでは 13 ですが、行レコードのキーと値のペアでは 12 であり、矛盾していることを示しています。

エラー 8223

ERROR 8223 (HY000): data inconsistency in table: t2, index: i1, handle: {hello, hello}, index-values:"" != record-values:"handle: {hello, hello}, values: [KindString hello KindString hello]"

このエラーは、 index-valuesが null でrecord-valuesが null ではないことを示します。つまり、行に対応するインデックスがないことを意味します。

理由と解決策

データ整合性エラーが発生した場合、次の理由が考えられます。

  • 既存のデータのデータとインデックスは一貫しており、現在のバージョンの TiDB にはバグがあります。進行中のトランザクションが一貫性のないデータを書き込もうとしている場合、TiDB はトランザクションを中止します。
  • 既存のデータのデータとインデックスに一貫性がありません。一貫性のないデータは、過去に誤って実行された危険な操作によるものか、TiDB のバグが原因である可能性があります。
  • データとインデックスは一致していますが、検出アルゴリズムには誤ってエラーを引き起こすバグがあります。

データの不一致エラーが発生した場合は、自分でエラーに対処するのではなく、すぐに PingCAP テクニカル サポートに連絡してトラブルシューティングを依頼してください。エラーが誤って報告されたことを PingCAP テクニカル サポートが確認した場合、またはアプリケーションがそのようなエラーを緊急にスキップする必要がある場合は、次の方法を使用してチェックをバイパスできます。

エラーチェックを無効にする

トランザクションの実行で報告された次のエラーについては、対応するチェックをバイパスできます。

  • エラー 8138、8139、および 8140 のチェックをバイパスするには、 set @@tidb_enable_mutation_checker=0を構成します。
  • エラー 8141 のチェックをバイパスするには、 set @@tidb_txn_assertion_level=OFFを構成します。

トランザクションの実行で報告された他のエラー、およびADMIN CHECK [TABLE|INDEX]ステートメントの実行中に報告されたすべてのエラーについては、データの不整合が既に発生しているため、対応するチェックをバイパスすることはできません。

SQLを書き換える

前のセクションで説明したtidb_enable_mutation_checkertidb_txn_assertion_levelを無効にすると、すべての SQL ステートメントの対応するチェックがバイパスされます。特定の SQL ステートメントで不整合エラーが誤って報告された場合は、別の実行演算子を使用して SQL ステートメントを別の同等の形式に書き直すことで、エラーの回避を試みることができます。

エコシステム
TiDB
TiKV
TiSpark
Chaos Mesh
© 2022 PingCAP. All Rights Reserved.