システム変数tidb_snapshotを使用して履歴データを読み取る

このドキュメントでは、システム変数tidb_snapshotを使用して履歴バージョンからデータを読み取る方法について説明します。これには、履歴データを保存するための具体的な使用例と戦略が含まれます。

注記:

ステイル読み取り機能を使用して履歴データを読み取ることもできます。こちらの方がお勧めです。

機能の説明

TiDB は、特別なクライアントやドライバーを使用せずに、標準の SQL インターフェイスを使用して履歴データを直接読み取る機能を実装します。

注記:

  • データが更新または削除された場合でも、SQL インターフェイスを使用してその履歴バージョンを読み取ることができます。
  • 履歴データを読み取る場合、TiDB は、現在のテーブル構造が異なっていても、古いテーブル構造でデータを返します。

TiDBが履歴バージョンからデータを読み取る方法

tidb_snapshotシステム変数はtidb_snapshot履歴データの読み取りをサポートするために導入されました。3 変数について:

  • 変数はSESSIONスコープ内で有効です。
  • その値はSETステートメントを使用して変更できます。
  • 変数のデータ型はテキストです。
  • 変数は、TSO (Timestamp Oracle) と datetime を受け入れます。TSO は、PD から取得されるグローバルに一意のタイム サービスです。受け入れられる datetime 形式は「2016-10-08 16:45:26.999」です。通常、datetime は秒精度を使用して設定できます (例:「2016-10-08 16:45:26」)。
  • 変数が設定されると、TiDB はデータ構造のためだけにその値をタイムスタンプとして使用してスナップショットを作成し、オーバーヘッドは発生しません。その後、すべてのSELECT操作はこのスナップショットからデータを読み取ります。

注記:

TiDB トランザクションのタイムスタンプは Placement Driver (PD) によって割り当てられるため、保存されたデータのバージョンも PD によって割り当てられたタイムスタンプに基づいてマークされます。スナップショットが作成される場合、バージョン番号はtidb_snapshot変数の値に基づきます。TiDBサーバーと PDサーバーのローカル時刻に大きな差がある場合は、PDサーバーの時刻を使用します。

履歴バージョンからデータを読み取った後、現在のセッションを終了するか、 SETステートメントを使用してtidb_snapshot変数の値を "" (空の文字列) に設定することで、最新バージョンからデータを読み取ることができます。

TiDBがデータバージョンを管理する方法

TiDB は、データ バージョンを管理するために、マルチバージョン同時実行制御 (MVCC) を実装しています。データの履歴バージョンは保持されます。これは、データ オブジェクトをその場で更新/削除するのではなく、更新/削除ごとにデータ オブジェクトの新しいバージョンが作成されるためです。ただし、すべてのバージョンが保持されるわけではありません。バージョンが特定の時間よりも古い場合は、履歴バージョンが多すぎることによるstorageの占有とパフォーマンスのオーバーヘッドを削減するために、完全に削除されます。

TiDBでは、ガベージコレクション(GC)が定期的に実行され、古いデータバージョンが削除されます。GCの詳細については、 TiDB ガベージコレクション (GC)参照してください。

以下の点に特に注意してください。

  • tidb_gc_life_time : このシステム変数は、以前の変更の保持時間を構成するために使用されます (デフォルト: 10m0s )。
  • SELECT * FROM mysql.tidb WHERE variable_name = 'tikv_gc_safe_point'の出力。これは、履歴データを読み取ることができる現在のsafePointです。ガベージコレクションプロセスが実行されるたびに更新されます。

  1. 最初の段階では、テーブルを作成し、いくつかの行のデータを挿入します。

    mysql> create table t (c int); Query OK, 0 rows affected (0.01 sec) mysql> insert into t values (1), (2), (3); Query OK, 3 rows affected (0.00 sec)
  2. 表内のデータをビュー。

    mysql> select * from t; +------+ | c | +------+ | 1 | | 2 | | 3 | +------+ 3 rows in set (0.00 sec)
  3. テーブルのタイムスタンプをビュー。

    mysql> select now(); +---------------------+ | now() | +---------------------+ | 2016-10-08 16:45:26 | +---------------------+ 1 row in set (0.00 sec)
  4. 1 行のデータを更新します。

    mysql> update t set c=22 where c=2; Query OK, 1 row affected (0.00 sec)
  5. データが更新されていることを確認します:

    mysql> select * from t; +------+ | c | +------+ | 1 | | 22 | | 3 | +------+ 3 rows in set (0.00 sec)
  6. スコープがセッションである変数をtidb_snapshot設定します。変数は、値の前に最新のバージョンが読み取れるように設定されます。

    注記:

    この例では、値は更新操作前の時間に設定されています。

    mysql> set @@tidb_snapshot="2016-10-08 16:45:26"; Query OK, 0 rows affected (0.00 sec)

    注記:

    @@はシステム変数を示すのに使用され、 @はユーザー変数を示すのに使用されるため、 tidb_snapshot前には@ではなく@@使用する必要があります。

    結果:次のステートメントから読み取られるのは、更新操作前のデータ、つまり履歴データです。

    mysql> select * from t; +------+ | c | +------+ | 1 | | 2 | | 3 | +------+ 3 rows in set (0.00 sec)
  7. 変数tidb_snapshot "" (空の文字列) に設定すると、最新バージョンからデータを読み取ることができます。

    mysql> set @@tidb_snapshot=""; Query OK, 0 rows affected (0.00 sec)
    mysql> select * from t; +------+ | c | +------+ | 1 | | 22 | | 3 | +------+ 3 rows in set (0.00 sec)

    注記:

    @@はシステム変数を示すのに使用され、 @はユーザー変数を示すのに使用されるため、 tidb_snapshot前には@ではなく@@使用する必要があります。

履歴データを復元する方法

古いバージョンからデータを復元する前に、作業中にガベージ コレクション (GC) によって履歴データが消去されないように注意してください。これは、次の例に示すようにtidb_gc_life_time変数を設定することで実行できます。復元後に変数を以前の値に戻すことを忘れないでください。

SET GLOBAL tidb_gc_life_time="60m";

注記:

GC の有効期間をデフォルトの 10 分から 30 分以上に増やすと、行の追加バージョンが保持され、より多くのディスク領域が必要になる場合があります。また、TiDB がデータ読み取り中に同じ行の追加バージョンをスキップする必要がある場合、スキャンなどの特定の操作のパフォーマンスにも影響する可能性があります。

古いバージョンからデータを復元するには、次のいずれかの方法を使用できます。

  • 単純なケースでは、変数tidb_snapshotを設定した後にSELECT使用して出力をコピーして貼り付けるか、またはSELECT ... INTO OUTFILEを使用してからLOAD DATAを使用して後でデータをインポートします。

  • 履歴スナップショットをエクスポートするにはDumpling使用します。Dumplingは、より大きなデータセットのエクスポートに適しています。

このページは役に立ちましたか?