楽観的トランザクションにおける書き込み競合のトラブルシューティング

このドキュメントでは、楽観的トランザクションにおける書き込み競合の原因と解決策を紹介します。

TiDB v3.0.8 より前のバージョンでは、TiDB はデフォルトで楽観的トランザクション モデルを使用します。このモデルでは、TiDB はトランザクション実行中に競合をチェックしません。代わりに、トランザクションが最終的にコミットされるときに、2 フェーズ コミット (2PC) がトリガーされ、TiDB は書き込み競合をチェックします。書き込み競合が存在し、自動再試行メカニズムが有効になっている場合、TiDB は制限時間内にトランザクションを再試行します。再試行が成功するか、再試行回数の上限に達した場合、TiDB はトランザクション実行の結果をクライアントに返します。したがって、TiDB クラスターに書き込み競合が多数存在する場合、期間は長くなる可能性があります。

書き込み競合の原因

TiDB はパーコレータートランザクション モデルを使用してトランザクションを実装しますpercolator一般的に 2PC の実装です。詳細な 2PC プロセスについてはTiDB 楽観的トランザクションモデル参照してください。

クライアントが TiDB にCOMMITリクエストを送信すると、TiDB は 2PC プロセスを開始します。

  1. TiDB は、トランザクション内のすべてのキーから 1 つのキーをトランザクションの主キーとして選択します。
  2. TiDB は、このコミットに関係するすべての TiKV リージョンにprewriteリクエストを送信します。TiKV は、すべてのキーが正常にプレビューできるかどうかを判断します。
  3. TiDB は、 prewriteリクエストがすべて成功したという結果を受け取ります。
  4. TiDB は PD からcommit_ts取得します。
  5. TiDB は、トランザクションの主キーを含む TiKVリージョンにcommitのリクエストを送信します。TiKV はcommitリクエストを受信すると、データの有効性をチェックし、 prewriteのステージに残っているロックをクリアします。
  6. commit目のリクエストが正常に返されると、TiDB はクライアントに成功を返します。

書き込み競合はステージprewriteで発生します。トランザクションが別のトランザクションが現在のキー ( data.commit_ts > txn.start_ts ) を書き込んでいることを検出すると、書き込み競合が発生します。

書き込み競合を検出する

TiDB Grafana パネルで、 KV エラーの下にある次の監視メトリックを確認します。

  • KV バックオフ OPS は、 TiKV によって返される 1 秒あたりのエラー メッセージの数を示します。

    kv-backoff-ops

    メトリックtxnlockは書き込み-書き込み競合を示します。メトリックtxnLockFastは読み取り-書き込み競合を示します。

  • ロック解決 OPS は、 1 秒あたりのトランザクション競合に関連する項目の数を示します。

    lock-resolve-ops

    • not_expiredロックの TTL が期限切れになっていないことを示します。競合トランザクションは、TTL が期限切れになるまでロックを解決できません。
    • wait_expired 、トランザクションがロックの有効期限が切れるまで待機する必要があることを示します。
    • expiredロックの TTL が期限切れになったことを示します。その後、競合トランザクションはこのロックを解決できます。
  • KV 再試行期間は、 KV 要求を再送信する期間を示します。

    kv-retry-duration

また、TiDB ログで検索するためのキーワードとして[kv:9007]Write conflict使用することもできます。キーワードは、クラスター内に書き込み競合が存在することも示します。

書き込み競合を解決する

クラスター内に書き込み競合が多数存在する場合は、書き込み競合キーとその理由を調べ、書き込み競合を回避するためにアプリケーション ロジックを変更することを推奨します。クラスター内に書き込み競合が存在する場合、TiDB ログ ファイルに次のようなログが表示されます。

[2020/05/12 15:17:01.568 +08:00] [WARN] [session.go:446] ["commit failed"] [conn=3] ["finished txn"="Txn{state=invalid}"] [error="[kv:9007]Write conflict, txnStartTS=416617006551793665, conflictStartTS=416617018650001409, conflictCommitTS=416617023093080065, key={tableID=47, indexID=1, indexValues={string, }} primary={tableID=47, indexID=1, indexValues={string, }} [try again later]"]

上記のログの説明は次のとおりです。

  • [kv:9007]Write conflict : 書き込み-書き込み競合を示します。
  • txnStartTS=416617006551793665 : 現在のトランザクションのstart_ts示します。4 pd-ctlを使用して、 start_ts物理時間に変換できます。
  • conflictStartTS=416617018650001409 : 書き込み競合トランザクションのstart_ts示します。
  • conflictCommitTS=416617023093080065 : 書き込み競合トランザクションのcommit_ts示します。
  • key={tableID=47, indexID=1, indexValues={string, }} : 書き込み競合キーを示します。2 tableID書き込み競合テーブルの ID を示します。4 indexID書き込み競合インデックスの ID を示します。書き込み競合キーがレコード キーの場合、ログにはhandle=x出力、どのレコード (行) に競合があるかが示されます。8 indexValues競合があるインデックスの値を示します。
  • primary={tableID=47, indexID=1, indexValues={string, }} : 現在のトランザクションの主キー情報を示します。

pd-ctlツールを使用して、タイムスタンプを読み取り可能な時間に変換できます。

tiup ctl:v<CLUSTER_VERSION> pd -u https://127.0.0.1:2379 tso {TIMESTAMP}

tableID使用して、関連するテーブルの名前を見つけることができます。

curl http://{TiDBIP}:10080/db-table/{tableID}

indexIDとテーブル名を使用して、関連するインデックスの名前を見つけることができます。

SELECT * FROM INFORMATION_SCHEMA.TIDB_INDEXES WHERE TABLE_SCHEMA='{db_name}' AND TABLE_NAME='{table_name}' AND INDEX_ID={indexID};

さらに、TiDB v3.0.8 以降のバージョンでは、悲観的トランザクションがデフォルト モードになります。悲観的悲観的モードでは、各 DML ステートメントは実行中に関連するキーに悲観的ロックを書き込みます。この悲観的ロックにより、他のトランザクションが同じキーを変更するのを防ぐことができるため、トランザクション 2PC のprewrite段階で書き込み競合が発生しないことが保証されます。

このページは役に立ちましたか?