- TiDB Cloudについて
- 始めましょう
- クラスターの管理
- データの移行
- サンプル データのインポート
- データを TiDB に移行する
- TiDB からのデータのエクスポート
- データのバックアップと復元
- 監視と警告
- パフォーマンスの調整
- 概要
- パフォーマンスを分析する
- SQL チューニング
- TiKV Follower Readの調整
- コプロセッサ キャッシュ
- ガベージ コレクション (GC)
- TiFlash のパフォーマンスを調整する
- ユーザー アクセスの管理
- 請求する
- 参照
- TiDB クラスターのアーキテクチャ
- TiDB Cloudクラスターの制限とクォータ
- TiDB の制限事項
- SQL
- TiDB で SQL を調べる
- SQL 言語の構造と構文
- SQL ステートメント
ADD COLUMN
ADD INDEX
ADMIN
ADMIN CANCEL DDL
ADMIN CHECKSUM TABLE
ADMIN CHECK [TABLE|INDEX]
ADMIN SHOW DDL [JOBS|QUERIES]
ALTER DATABASE
ALTER INDEX
ALTER TABLE
ALTER TABLE COMPACT
ALTER USER
ANALYZE TABLE
BATCH
BEGIN
CHANGE COLUMN
COMMIT
CHANGE DRAINER
CHANGE PUMP
CREATE [GLOBAL|SESSION] BINDING
CREATE DATABASE
CREATE INDEX
CREATE ROLE
CREATE SEQUENCE
CREATE TABLE LIKE
CREATE TABLE
CREATE USER
CREATE VIEW
DEALLOCATE
DELETE
DESC
DESCRIBE
DO
DROP [GLOBAL|SESSION] BINDING
DROP COLUMN
DROP DATABASE
DROP INDEX
DROP ROLE
DROP SEQUENCE
DROP STATS
DROP TABLE
DROP USER
DROP VIEW
EXECUTE
EXPLAIN ANALYZE
EXPLAIN
FLASHBACK TABLE
FLUSH PRIVILEGES
FLUSH STATUS
FLUSH TABLES
GRANT <privileges>
GRANT <role>
INSERT
KILL [TIDB]
MODIFY COLUMN
PREPARE
RECOVER TABLE
RENAME INDEX
RENAME TABLE
REPLACE
REVOKE <privileges>
REVOKE <role>
ROLLBACK
SELECT
SET DEFAULT ROLE
SET [NAMES|CHARACTER SET]
SET PASSWORD
SET ROLE
SET TRANSACTION
SET [GLOBAL|SESSION] <variable>
SHOW ANALYZE STATUS
SHOW [GLOBAL|SESSION] BINDINGS
SHOW BUILTINS
SHOW CHARACTER SET
SHOW COLLATION
SHOW [FULL] COLUMNS FROM
SHOW CREATE SEQUENCE
SHOW CREATE TABLE
SHOW CREATE USER
SHOW DATABASES
SHOW DRAINER STATUS
SHOW ENGINES
SHOW ERRORS
SHOW [FULL] FIELDS FROM
SHOW GRANTS
SHOW INDEX [FROM|IN]
SHOW INDEXES [FROM|IN]
SHOW KEYS [FROM|IN]
SHOW MASTER STATUS
SHOW PLUGINS
SHOW PRIVILEGES
SHOW [FULL] PROCESSSLIST
SHOW PROFILES
SHOW PUMP STATUS
SHOW SCHEMAS
SHOW STATS_HEALTHY
SHOW STATS_HISTOGRAMS
SHOW STATS_META
SHOW STATUS
SHOW TABLE NEXT_ROW_ID
SHOW TABLE REGIONS
SHOW TABLE STATUS
SHOW [FULL] TABLES
SHOW [GLOBAL|SESSION] VARIABLES
SHOW WARNINGS
SHUTDOWN
SPLIT REGION
START TRANSACTION
TABLE
TRACE
TRUNCATE
UPDATE
USE
WITH
- データ型
- 関数と演算子
- クラスタ化インデックス
- 制約
- 生成された列
- SQL モード
- テーブル属性
- 取引
- ビュー
- パーティショニング
- 一時テーブル
- キャッシュされたテーブル
- 文字セットと照合順序
- 履歴データの読み取り
- システム テーブル
mysql
- 情報_スキーマ
- 概要
ANALYZE_STATUS
CLIENT_ERRORS_SUMMARY_BY_HOST
CLIENT_ERRORS_SUMMARY_BY_USER
CLIENT_ERRORS_SUMMARY_GLOBAL
CHARACTER_SETS
CLUSTER_INFO
COLLATIONS
COLLATION_CHARACTER_SET_APPLICABILITY
COLUMNS
DATA_LOCK_WAITS
DDL_JOBS
DEADLOCKS
ENGINES
KEY_COLUMN_USAGE
PARTITIONS
PROCESSLIST
REFERENTIAL_CONSTRAINTS
SCHEMATA
SEQUENCES
SESSION_VARIABLES
SLOW_QUERY
STATISTICS
TABLES
TABLE_CONSTRAINTS
TABLE_STORAGE_STATS
TIDB_HOT_REGIONS_HISTORY
TIDB_INDEXES
TIDB_SERVERS_INFO
TIDB_TRX
TIFLASH_REPLICA
TIKV_REGION_PEERS
TIKV_REGION_STATUS
TIKV_STORE_STATUS
USER_PRIVILEGES
VIEWS
- システム変数
- ストレージ エンジン
- TiKV
- ティフラッシュ
- Dumpling
- テーブル フィルター
- データとインデックス間の不一致のトラブルシューティング
- よくある質問
- リリースノート
- サポート
- 用語集
GCの概要
TiDBは、MVCCを使用してトランザクションの同時実行性を制御します。データを更新しても、元のデータはすぐには削除されませんが、バージョンを区別するためのタイムスタンプとともに、新しいデータと一緒に保持されます。ガベージコレクション(GC)の目的は、廃止されたデータをクリアすることです。
GCプロセス
各TiDBクラスタには、GCプロセスを制御するGCリーダーとして選択されたTiDBインスタンスが含まれています。
GCはTiDBで定期的に実行されます。各GCについて、TiDBは最初に「セーフポイント」と呼ばれるタイムスタンプを計算します。次に、TiDBは、セーフポイント以降のすべてのスナップショットがデータの整合性を保持していることを前提として、廃止されたデータをクリアします。具体的には、各GCプロセスには次の3つのステップが含まれます。
- ロックを解決します。このステップでは、TiDBはすべてのリージョンのセーフポイントの前でロックをスキャンし、これらのロックをクリアします。
- 範囲を削除します。このステップの間に、
DROP TABLE
/DROP INDEX
操作から生成された全範囲の廃止されたデータがすぐにクリアされます。 - GCを実行します。このステップでは、各TiKVノードがそのデータをスキャンし、各キーの不要な古いバージョンを削除します。
デフォルト構成では、GCは10分ごとにトリガーされます。各GCは、最近の10分間のデータを保持します。これは、GCの寿命がデフォルトで10分であることを意味します(セーフポイント=現在の時刻-GCの寿命)。 1ラウンドのGCの実行時間が長すぎると、このラウンドのGCが完了する前に、次のGCをトリガーする時間であっても、次のラウンドのGCは開始されません。さらに、GCの有効期間を超えた後、長期間のトランザクションが適切に実行されるためには、セーフポイントは進行中のトランザクションの開始時間(start_ts)を超えません。
実装の詳細
ロックを解決する
TiDBトランザクションモデルはグーグルのパーコレーターに基づいて実装されます。これは主に、いくつかの実用的な最適化を備えた2フェーズコミットプロトコルです。最初のフェーズが終了すると、関連するすべてのキーがロックされます。これらのロックのうち、1つはプライマリロックで、もう1つはプライマリロックへのポインタを含むセカンダリロックです。 2番目のフェーズでは、プライマリロックのあるキーが書き込みレコードを取得し、そのロックが削除されます。書き込みレコードは、このキーの履歴またはトランザクションロールバックレコード内の書き込みまたは削除操作を示します。プライマリロックを置き換える書き込みレコードのタイプは、対応するトランザクションが正常にコミットされたかどうかを示します。次に、すべての2次ロックが連続して交換されます。障害などの理由でこれらのセカンダリロックが保持され、置き換えられない場合でも、セカンダリロックの情報に基づいてプライマリキーを見つけ、プライマリキーがコミットされているかどうかに基づいてトランザクション全体がコミットされているかどうかを判断できます。ただし、プライマリキー情報がGCによってクリアされ、このトランザクションにコミットされていないセカンダリロックがある場合、これらのロックをコミットできるかどうかを知ることはできません。その結果、データの整合性は保証されません。
[ロックの解決]ステップは、セーフポイントの前にロックをクリアします。これは、ロックの主キーがコミットされている場合、このロックをコミットする必要があることを意味します。それ以外の場合は、ロールバックする必要があります。主キーがまだロックされている(コミットまたはロールバックされていない)場合、このトランザクションはタイムアウトしてロールバックされたと見なされます。
ロックの解決ステップは、システム変数tidb_gc_scan_lock_mode
を使用して構成できる次の2つの方法のいずれかで実装されます。
現在、 PHYSICAL
(Green GC)は実験的機能です。実稼働環境での使用はお勧めしません。
LEGACY
(デフォルト):GCリーダーは、廃止されたロックをスキャンする要求をすべてのリージョンに送信し、スキャンされたロックの主キーステータスを確認し、対応するトランザクションをコミットまたはロールバックする要求を送信します。PHYSICAL
:TiDBはRaftレイヤーをバイパスし、各TiKVノードのデータを直接スキャンします。
範囲を削除する
DROP TABLE/INDEX
などの操作中に、連続するキーを持つ大量のデータが削除されます。各キーを削除し、後でそれらに対してGCを実行すると、ストレージの再利用の実行効率が低下する可能性があります。このようなシナリオでは、TiDBは実際には各キーを削除しません。代わりに、削除する範囲と削除のタイムスタンプのみを記録します。次に、[範囲の削除]ステップは、タイムスタンプがセーフポイントより前にある範囲に対して高速な物理的削除を実行します。
GCを行う
Do GCステップは、すべてのキーの古いバージョンをクリアします。セーフポイントの後のすべてのタイムスタンプに一貫したスナップショットがあることを保証するために、この手順では、セーフポイントの前にコミットされたデータを削除しますが、削除でない限り、セーフポイントの前の各キーの最後の書き込みを保持します。
このステップでは、TiDBはセーフポイントをPDに送信するだけでよく、GCのラウンド全体が完了します。 TiKVはセーフポイントの変更を自動的に検出し、現在のノード上のすべてのリージョンリーダーに対してGCを実行します。同時に、GCリーダーはGCの次のラウンドをトリガーし続けることができます。
ノート:
TiDB 5.0以降、DoGCステップは常に
DISTRIBUTED
モードを使用します。これは、各リージョンにGCリクエストを送信するTiDBサーバーによって実装されていた以前のCENTRAL
モードに代わるものです。