重要

このページは英語版のページを機械翻訳しています。原文はこちらからご覧ください。

TiDB 5.0 の新機能

発売日: 2021年4月7日

TiDB バージョン: 5.0.0

バージョン 5.0 では、PingCAP は、企業が TiDB に基づいてアプリケーションを迅速に構築できるように支援し、データベースパフォーマンス、パフォーマンスジッター、セキュリティ、高可用性、災害復旧、SQL パフォーマンスのトラブルシューティングなどに関する心配から解放することに重点を置いています。

v5.0 の主な新機能または改善点は次のとおりです。

TiFlashノードを通じて超並列処理 (MPP)アーキテクチャを導入し、大規模な結合クエリの実行ワークロードをTiFlashノード間で共有します。MPP モードを有効にすると、TiDB はコストに基づいて、MPP フレームワークを使用して計算を実行するかどうかを決定します。MPP モードでは、計算中に結合キーがExchange操作を通じて再分配されるため、計算負荷が各TiFlashノードに分散され、計算が高速化されます。ベンチマークによると、同じクラスターリソースの場合、TiDB 5.0 MPP は Greenplum 6.15.0 および Apache Spark 3.1.1 よりも 2 ～ 3 倍高速化され、一部のクエリでは 8 倍のパフォーマンスが向上しました。
クラスター化インデックス機能を導入して、データベースのパフォーマンスを向上させます。たとえば、TPC-C tpmC テストでは、クラスター化インデックスを有効にした TiDB のパフォーマンスが 39% 向上します。
非同期コミット機能を有効にすると、書き込みレイテンシーが短縮されます。たとえば、64 スレッドの Sysbench テストでは、非同期コミットを有効にすると、インデックス更新の平均レイテンシーが12.04 ミリ秒から 7.01 ミリ秒に 41.7% 短縮されます。
ジッターを減らします。これは、オプティマイザーの安定性を向上させ、システムタスクによる I/O、ネットワーク、CPU、メモリリソースの使用を制限することで実現されます。たとえば、8 時間のパフォーマンステストでは、TPC-C tpmC の標準偏差は 2% を超えません。
スケジュールを改善し、実行計画を可能な限り安定させることで、システムの安定性を高めます。
リージョンメンバーシップの変更中にシステムの可用性を確保するRaft Joint Consensus アルゴリズムを導入します。
EXPLAIN機能と非表示のインデックスを最適化し、データベース管理者 (DBA) が SQL ステートメントをより効率的にデバッグできるようにします。
企業データの信頼性を保証します。TiDB から Amazon S3storageや Google Cloud GCS にデータをバックアップしたり、これらのクラウドstorageプラットフォームからデータを復元したりできます。
Amazon S3storageまたは TiDB/MySQL からのデータインポートまたはデータエクスポートのパフォーマンスが向上し、企業がクラウド上でアプリケーションを迅速に構築できるようになります。たとえば、TPC-C テストでは、1 TiB データのインポートのパフォーマンスが 254 GiB/h から 366 GiB/h に 40% 向上します。

互換性の変更

システム変数

複数の演算子の同時実行を制御するには、 tidb_executor_concurrencyシステム変数を追加します。以前のtidb_*_concurrency設定 ( tidb_projection_concurrencyなど) は引き続き有効ですが、使用すると警告が表示されます。
ASCII 文字セットを書き込むときに ASCII 検証チェックをスキップするかどうかを指定するには、 tidb_skip_ascii_checkシステム変数を追加します。このデフォルト値はOFFです。
tidb_enable_strict_double_type_checkシステム変数を追加して、 double(N)のような構文をテーブルスキーマで定義できるかどうかを決定します。このデフォルト値はOFFです。
デフォルト値tidb_dml_batch_sizeを20000から0に変更します。これは、 LOAD / INSERT INTO SELECT ...ではバッチ DML ステートメントがデフォルトで使用されなくなることを意味します。代わりに、厳密なACIDセマンティクスに準拠するために大規模なトランザクションが使用されます。
注記：
変数のスコープはセッションからグローバルに変更され、デフォルト値は20000から0に変更されます。アプリケーションが元のデフォルト値に依存している場合は、アップグレード後にset globalステートメントを使用して変数を元の値に変更する必要があります。
tidb_enable_noop_functionsシステム変数を使用して、一時テーブルの構文の互換性を制御します。この変数値がOFFの場合、 CREATE TEMPORARY TABLE構文はエラーを返します。
ガベージコレクション関連のパラメータを直接制御するには、次のシステム変数を追加します。
デフォルト値enable-joint-consensusをfalseからtrueに変更します。これにより、共同コンセンサス機能がデフォルトで有効になります。
tidb_enable_amend_pessimistic_txnの値を0または1からONまたはOFFに変更します。
デフォルト値tidb_enable_clustered_indexをOFFからINT_ONLYに変更し、次の新しい意味を追加します。
- ON : クラスター化インデックスが有効です。非クラスター化インデックスの追加または削除がサポートされています。
- OFF : クラスター化インデックスは無効です。非クラスター化インデックスの追加または削除はサポートされています。
- INT_ONLY : デフォルト値。動作は v5.0 以前と同じです。 alter-primary-key = falseと組み合わせて、 INT 型のクラスター化インデックスを有効にするかどうかを制御できます。
  注記：
  5.0 GA のtidb_enable_clustered_indexのINT_ONLY値は、 5.0 RC のOFF値と同じ意味を持ちます。 OFF設定の 5.0 RC クラスターから 5.0 GA にアップグレードすると、 INT_ONLYとして表示されます。

コンフィグレーションファイルのパラメータ

TiDB のindex-limit構成項目を追加します。その値はデフォルトで64に設定され、範囲は[64,512]です。MySQL テーブルは最大 64 個のインデックスをサポートします。その値がデフォルト設定を超え、テーブルに対して 64 個を超えるインデックスが作成されると、テーブルスキーマが MySQL に再インポートされたときにエラーが報告されます。
TiDB が MySQL の ENUM/SET の長さ (ENUM の長さ < 255) と互換性と一貫性を保つために、 enable-enum-length-limit構成項目を追加します。デフォルト値はtrueです。
pessimistic-txn.enable構成項目をtidb_txn_mode環境変数に置き換えます。
performance.max-memory構成項目をperformance.server-memory-quotaに置き換える
tikv-client.copr-cache.enable構成項目をtikv-client.copr-cache.capacity-mbに置き換えます。項目の値が0.0の場合、この機能は無効になります。項目の値が0.0より大きい場合、この機能は有効になります。デフォルト値は1000.0です。
rocksdb.auto-tuned構成項目をrocksdb.rate-limiter-auto-tunedに置き換えます。
raftstore.sync-log設定項目を削除します。デフォルトでは、書き込まれたデータは強制的にディスクに書き出されます。v5.0 より前は、 raftstore.sync-log明示的に無効にできました。v5.0 以降では、設定値は強制的にtrueに設定されます。
gc.enable-compaction-filter構成項目のデフォルト値をfalseからtrueに変更します。
enable-cross-table-merge構成項目のデフォルト値をfalseからtrueに変更します。
rate-limiter-auto-tuned構成項目のデフォルト値をfalseからtrueに変更します。

その他

アップグレード前に、TiDB 構成feedback-probabilityの値を確認してください。値が 0 でない場合、アップグレード後に「回復可能な goroutine でpanicが発生しました」というエラーが発生しますが、このエラーはアップグレードには影響しません。
データの正確性の問題を回避するために、列タイプの変更中にVARCHARタイプとCHARタイプ間の変換を禁止します。

新機能

構文

List パーティショニング（Experimental）

ユーザードキュメント

リストパーティション機能を使用すると、大量のデータを含むテーブルを効率的にクエリおよび管理できます。

この機能を有効にすると、パーティションと、パーティション間でのデータの分散方法がPARTITION BY LIST(expr) PARTITION part_name VALUES IN (...)式に従って定義されます。パーティション化されたテーブルのデータセットは、最大 1024 個の異なる整数値をサポートします。値はPARTITION ... VALUES IN (...)句を使用して定義できます。

リストのパーティション分割を有効にするには、セッション変数tidb_enable_list_partitionをONに設定します。

List COLUMNS パーティショニング（Experimental）

ユーザードキュメント

List COLUMNS パーティショニングは、リストパーティションのバリエーションです。複数の列をパーティションキーとして使用できます。整数データ型の他に、文字列DATETIME DATE型の列もパーティション列として使用できます。

List COLUMNS パーティショニングを有効にするには、セッション変数tidb_enable_list_partitionをONに設定します。

目に見えないインデックス

ユーザードキュメント , ＃9246

パフォーマンスを調整したり、最適なインデックスを選択したりする場合、SQL ステートメントを使用してインデックスをVisibleまたはInvisible設定できます。この設定により、 DROP INDEXやADD INDEXなどのリソースを消費する操作の実行を回避できます。

インデックスの可視性を変更するには、 ALTER INDEXステートメントを使用します。変更後、オプティマイザーはインデックスの可視性に基づいて、このインデックスをインデックスリストに追加するかどうかを決定します。

`EXCEPT`および`INTERSECT`演算子

ユーザードキュメント , ＃18031

INTERSECT演算子はセット演算子であり、2 つ以上のクエリの結果セットの積集合を返します。ある程度、これはInner Join演算子の代替となります。

EXCEPT演算子はセット演算子であり、2 つのクエリの結果セットを結合し、最初のクエリ結果にはあるが 2 番目のクエリ結果にはない要素を返します。

トランザクション

＃18005

悲観的トランザクションモードでは、トランザクションに関係するテーブルに同時 DDL 操作またはSCHEMA VERSION変更が含まれている場合、システムはトランザクションのSCHEMA VERSION最新のものに自動的に更新して、トランザクションのコミットが成功することを保証し、トランザクションが DDL 操作またはSCHEMA VERSION変更によって中断されたときにクライアントがInformation schema is changedエラーを受け取ることを回避します。

この機能はデフォルトで無効になっています。この機能を有効にするには、 tidb_enable_amend_pessimistic_txnシステム変数の値を変更します。この機能は v4.0.7 で導入され、v5.0 では次の問題が修正されています。

TiDB BinlogがAdd Column操作を実行するときに発生する互換性の問題
この機能をユニークインデックスと併用すると発生するデータの不整合の問題
追加されたインデックスとこの機能を併用すると発生するデータの不整合の問題

現在、この機能には次のような非互換性の問題が残っています。

同時トランザクションがある場合、トランザクションのセマンティクスが変わる可能性があります
この機能を TiDB Binlogと併用すると発生する既知の互換性の問題
Change Columnとの互換性がない

文字セットと照合順序

utf8mb4_unicode_ciとutf8_unicode_ci ＃17596をサポートしますユーザードキュメント
照合順序の大文字と小文字を区別しない比較ソートをサポートする

Security

ユーザードキュメント , ＃18566

セキュリティコンプライアンス要件（一般データ保護規則（GDPR）など）を満たすために、システムは出力エラーメッセージとログ内の情報（IDやクレジットカード番号など）の機密性を下げることをサポートしており、これにより機密情報の漏洩を防ぐことができます。

TiDB は出力ログ情報の感度低下をサポートしています。この機能を有効にするには、次のスイッチを使用します。

グローバル変数tidb_redact_log 。デフォルト値は0で、これは感度低下が無効であることを意味します。tidb-server ログの感度低下を有効にするには、変数値を1に設定します。
設定項目security.redact-info-log 。デフォルト値はfalseで、これは感度低下が無効であることを意味します。tikv-server ログの感度低下を有効にするには、変数値をtrueに設定します。
構成項目security.redact-info-log 。デフォルト値はfalseで、これは感度低下が無効であることを意味します。pd-server ログの感度低下を有効にするには、変数値をtrueに設定します。
tiflash-server の場合は設定項目security.redact_info_log 、tiflash-learner の場合は設定項目security.redact-info-logです。デフォルト値は両方ともfalseで、これは感度低下が無効であることを意味します。tiflash-server および tiflash-learner ログの感度低下を有効にするには、両方の変数の値をtrueに設定します。

この機能はバージョン 5.0 で導入されました。この機能を使用するには、システム変数と上記のすべての構成項目を有効にします。

パフォーマンスの最適化

MPPアーキテクチャ

ユーザードキュメント

TiDB は、 TiFlashノードを通じて MPPアーキテクチャを導入します。このアーキテクチャにより、複数のTiFlashノードが大規模な結合クエリの実行ワークロードを共有できるようになります。

MPP モードがオンの場合、TiDB は計算コストに基づいて、計算のためにクエリを MPP エンジンに送信するかどうかを決定します。MPP モードでは、TiDB はデータ計算 ( Exchange操作) 中に結合キーを再配布することにより、実行中の各TiFlashノードにテーブル結合の計算を分散し、計算を高速化します。さらに、 TiFlashがすでにサポートしている集計コンピューティング機能を使用すると、TiDB はクエリの計算をTiFlash MPP クラスターにプッシュダウンできます。分散環境により、実行プロセス全体が高速化され、分析クエリの速度が大幅に向上します。

TPC-H 100 ベンチマークテストでは、 TiFlash MPP は従来の分析データベースの分析エンジンや Hadoop 上の SQL よりも大幅に処理速度が速いことが示されています。このアーキテクチャにより、最新のトランザクションデータに対して大規模な分析クエリを直接実行でき、従来のオフライン分析ソリューションよりも高いパフォーマンスが得られます。ベンチマークによると、同じクラスターリソースの場合、TiDB 5.0 MPP は Greenplum 6.15.0 や Apache Spark 3.1.1 よりも 2 ～ 3 倍高速化しており、一部のクエリでは 8 倍のパフォーマンス向上が見られます。

現在、MPP モードでサポートされていない主な機能は次のとおりです (詳細についてはTiFlashを使用するを参照してください)。

テーブルパーティション
ウィンドウ関数
照合
いくつかの組み込み関数
TiKVからデータを読み取る
OOMスピル
連合
完全外部結合

クラスター化インデックス

ユーザードキュメント , ＃4841

テーブル構造を設計したり、データベースの動作を分析したりする際に、主キーを持つ一部の列が頻繁にグループ化され、並べ替えられ、これらの列に対するクエリによって特定の範囲のデータまたは異なる値を持つ少量のデータが返されることが多く、対応するデータによって読み取りまたは書き込みのホットスポットの問題が発生しない場合は、クラスター化インデックス機能を使用することをお勧めします。

クラスター化インデックスは、一部のデータベース管理システムではインデックス構成テーブルとも呼ばれ、テーブルのデータに関連付けられたstorage構造です。クラスター化インデックスを作成するときに、テーブルから 1 つ以上の列をインデックスのキーとして指定できます。TiDB はこれらのキーを特定の構造に格納します。これにより、TiDB はキーに関連付けられた行を迅速かつ効率的に見つけることができるため、データのクエリと書き込みのパフォーマンスが向上します。

クラスター化インデックス機能を有効にすると、次の場合に TiDB のパフォーマンスが大幅に向上します (たとえば、TPC-C tpmC テストでは、クラスター化インデックスを有効にした TiDB のパフォーマンスが 39% 向上します)。

データが挿入されると、クラスター化インデックスにより、ネットワークからのインデックスデータの書き込みが 1 回削減されます。
同等の条件を持つクエリに主キーのみが関係する場合、クラスター化インデックスにより、ネットワークからのインデックスデータの読み取りが 1 回削減されます。
範囲条件を持つクエリに主キーのみが関係する場合、クラスター化インデックスにより、ネットワークからのインデックスデータの複数回の読み取りが削減されます。
同等条件または範囲条件を持つクエリに主キープレフィックスが含まれる場合、クラスター化インデックスによって、ネットワークからのインデックスデータの複数回の読み取りが削減されます。

各テーブルでは、クラスター化インデックスまたは非クラスター化インデックスを使用してデータを並べ替えて保存できます。これら 2 つのstorage構造の違いは次のとおりです。

クラスター化インデックスを作成する場合、テーブル内の 1 つ以上の列をインデックスのキー値として指定できます。クラスター化インデックスは、キー値に従ってテーブルのデータを並べ替えて格納します。各テーブルには、クラスター化インデックスを 1 つだけ含めることができます。テーブルにクラスター化インデックスがある場合は、クラスター化インデックステーブルと呼ばれます。それ以外の場合は、非クラスター化インデックステーブルと呼ばれます。
非クラスター化インデックスを作成すると、テーブル内のデータは順序付けされていない構造で格納されます。TiDB は各データ行に一意の ROWID を自動的に割り当てるため、非クラスター化インデックスのキー値を明示的に指定する必要はありません。クエリの実行中、ROWID は対応する行の検索に使用されます。データのクエリまたは挿入を実行すると、少なくとも 2 つのネットワーク I/O 操作が発生するため、クラスター化インデックスと比較してパフォーマンスが低下します。

テーブルデータが変更されると、データベースシステムはクラスター化インデックスと非クラスター化インデックスを自動的に維持します。

すべての主キーは、デフォルトで非クラスター化インデックスとして作成されます。次の 2 つの方法のいずれかで、主キーをクラスター化インデックスまたは非クラスター化インデックスとして作成できます。

テーブルを作成するときにステートメントにキーワードCLUSTERED | NONCLUSTEREDを指定すると、システムは指定された方法でテーブルを作成します。構文は次のとおりです。

CREATE TABLE `t` (`a` VARCHAR(255), `b` INT, PRIMARY KEY (`a`, `b`) CLUSTERED);

または

CREATE TABLE `t` (`a` VARCHAR(255) PRIMARY KEY CLUSTERED, `b` INT);

ステートメントSHOW INDEX FROM tbl-nameを実行すると、テーブルにクラスター化インデックスがあるかどうかを照会できます。

クラスター化インデックス機能を制御するには、システム変数tidb_enable_clustered_indexを構成します。サポートされる値はON 、 OFF 、およびINT_ONLYです。
- ON : すべての種類の主キーに対してクラスター化インデックス機能が有効になっていることを示します。非クラスター化インデックスの追加と削除がサポートされています。
- OFF : すべての種類の主キーに対してクラスター化インデックス機能が無効になっていることを示します。非クラスター化インデックスの追加と削除はサポートされています。
- INT_ONLY : デフォルト値。変数がINT_ONLYに設定され、 alter-primary-key falseに設定されている場合、単一の整数列で構成される主キーは、デフォルトでクラスター化インデックスとして作成されます。この動作は、TiDB v5.0 以前のバージョンの動作と一致しています。

CREATE TABLEステートメントにキーワードCLUSTERED | NONCLUSTEREDが含まれている場合、そのステートメントはシステム変数と構成項目の構成をオーバーライドします。

ステートメントでキーワードCLUSTERED | NONCLUSTEREDを指定して、クラスター化インデックス機能を使用することをお勧めします。これにより、TiDB はシステム内のクラスター化インデックスと非クラスター化インデックスのすべてのデータ型を必要に応じて同時に使用できるようになります。

INT_ONLY 、この機能の互換性を保つために一時的に使用されているもので、将来的には廃止される予定であるため、 tidb_enable_clustered_index = INT_ONLY使用はお勧めしません。

クラスター化インデックスの制限は次のとおりです。

クラスター化インデックスと非クラスター化インデックス間の相互変換はサポートされていません。
クラスター化インデックスの削除はサポートされていません。
ALTER TABLEステートメントを使用したクラスター化インデックスの追加、削除、および変更はサポートされていません。
クラスター化インデックスの再編成と再作成はサポートされていません。
インデックスの有効化または無効化はサポートされていないため、非表示のインデックス機能はクラスター化インデックスには効果がありません。
クラスター化インデックスとしてUNIQUE KEYを作成することはサポートされていません。
クラスター化インデックス機能を TiDB Binlogと併用することはサポートされていません。TiDB Binlogを有効にすると、TiDB はクラスター化インデックスとして単一の整数主キーの作成のみをサポートします。TiDB Binlog は、クラスター化インデックスを持つ既存のテーブルのデータ変更をダウンストリームに複製しません。
クラスター化インデックス機能を属性SHARD_ROW_ID_BITSおよびPRE_SPLIT_REGIONSと併用することはサポートされていません。
クラスターを新しいバージョンにアップグレードしてからロールバックする場合は、ロールバック前にテーブルデータをエクスポートし、ロールバック後にデータをインポートして、新しく追加されたテーブルをダウングレードする必要があります。他のテーブルは影響を受けません。

非同期コミット

ユーザードキュメント , ＃8316

データベースのクライアントは、データベースシステムが 2 フェーズ (2PC) で同期的にトランザクションコミットを完了するまで待機します。トランザクションは、第 1 フェーズのコミットが成功した後に結果をクライアントに返し、システムは第 2 フェーズのコミット操作をバックグラウンドで非同期的に実行して、トランザクションコミットのレイテンシーを短縮します。トランザクションの書き込みに 1 つのリージョンのみが含まれる場合、第 2 フェーズは直接省略され、トランザクションは 1 フェーズコミットになります。

非同期コミット機能を有効にした後、同じハードウェアと構成で、Sysbench を 64 スレッドで更新インデックスをテストするように設定すると、平均レイテンシーは12.04 ミリ秒から 7.01 ミリ秒に 41.7% 減少します。

非同期コミット機能を有効にすると、ネットワークインタラクションのレイテンシーを減らし、データ書き込みのパフォーマンスを向上させるために、データベースアプリケーション開発者は、トランザクションの一貫性を線形一貫性から因果関係の一貫性に減らすことを検討することをお勧めします。因果一貫性を有効にする SQL ステートメントはSTART TRANSACTION WITH CAUSAL CONSISTENCYです。

因果一貫性を有効にした後、同じハードウェアと構成で、Sysbench を 64 スレッドで oltp_write_only をテストするように設定すると、平均レイテンシーは11.86 ミリ秒から 11.19 ミリ秒に 5.6% 減少しました。

トランザクションの一貫性が線形一貫性から因果一貫性に低下した後、アプリケーション内の複数のトランザクション間に相互依存性がない場合、トランザクションはグローバルに一貫した順序を持ちません。

新しく作成された v5.0 クラスターでは、非同期コミット機能がデフォルトで有効になっています。

この機能は、以前のバージョンから v5.0 にアップグレードされたクラスターではデフォルトで無効になっています。この機能を有効にするには、 set global tidb_enable_async_commit = ON;およびset global tidb_enable_1pc = ON;ステートメントを実行します。

非同期コミット機能の制限は次のとおりです。

直接のダウングレードはサポートされていません。

コプロセッサーキャッシュ機能をデフォルトで有効にする

ユーザードキュメント , ＃18028

5.0 GA では、コプロセッサーキャッシュ機能がデフォルトで有効になっています。この機能を有効にすると、データの読み取りのレイテンシーを削減するために、TiDB は tikv-server にプッシュダウンされた演算子の計算結果を tidb-server にキャッシュします。

コプロセッサーキャッシュ機能を無効にするには、 tikv-client.copr-cache ～ 0.0のcapacity-mbの構成項目を変更します。

`delete from table where id <? Limit ?`ステートメントの実行パフォーマンスを向上

＃18028

delete from table where id <? limit ?ステートメントの p99 パフォーマンスが 4 倍向上します。

ロードベースの分割戦略を最適化して、一部の小さなテーブルのホットスポット読み取りシナリオでデータを分割できないというパフォーマンスの問題を解決します。

＃18005

安定性の向上

不完全なスケジューリングによって発生するパフォーマンスジッターの問題を最適化します

＃18005

TiDB のスケジューリングプロセスは、I/O、ネットワーク、CPU、メモリなどのリソースを占有します。TiDB がスケジュールされたタスクを制御しない場合、リソースのプリエンプションにより QPS と遅延によってパフォーマンスのジッターが発生する可能性があります。

以下の最適化を行った後、8 時間のパフォーマンステストでは、TPC-C tpmC の標準偏差は 2% を超えません。

不要なスケジューリングとパフォーマンスのジッターを削減するための新しいスケジューリング計算式を導入

ノード容量が常にシステムで設定されたウォーターラインに近い場合、またはstore-limitが大きすぎる場合、容量負荷のバランスをとるために、システムは頻繁にリージョンを他のノードにスケジュールしたり、リージョンを元のノードに戻してスケジュールしたりします。スケジューリングは I/O、ネットワーク、CPU、メモリなどのリソースを占有し、パフォーマンスのジッターを引き起こすため、このタイプのスケジューリングは必要ありません。

この問題を緩和するために、PD では新しいデフォルトのスケジュール計算式が導入されています。 region-score-formula-version = v1設定することで、古い式に戻すことができます。

デフォルトでクロステーブルリージョン結合機能を有効にする

ユーザードキュメント

v5.0 より前の TiDB では、テーブル間のリージョンマージ機能がデフォルトで無効になっています。v5.0 以降では、空のリージョンの数と、ネットワーク、メモリ、CPU のオーバーヘッドを削減するために、この機能がデフォルトで有効になっています。1 schedule.enable-cross-table-merge構成項目を変更することで、この機能を無効にすることができます。

バックグラウンドタスクとフォアグラウンドの読み取りおよび書き込み間のI/Oリソースの競合のバランスをとるために、デフォルトでシステムが自動的にデータ圧縮速度を調整するようにする

ユーザードキュメント

v5.0 より前では、バックグラウンドタスクとフォアグラウンドの読み取りおよび書き込み間の I/O リソースの競合のバランスをとるために、システムがデータ圧縮速度を自動的に調整する機能はデフォルトで無効になっています。v5.0 以降、TiDB はこの機能をデフォルトで有効にし、アルゴリズムを最適化してレイテンシージッターを大幅に削減します。

rate-limiter-auto-tuned構成項目を変更することで、この機能を無効にすることができます。

GC 圧縮フィルター機能をデフォルトで有効にして、GC による CPU と I/O リソースの消費を削減します。

ユーザードキュメント , ＃18009

TiDB がガベージコレクション(GC) とデータ圧縮を実行すると、パーティションが CPU と I/O リソースを占有します。これら 2 つのタスクの実行中に重複データが存在します。

GC による CPU と I/O リソースの消費を減らすために、GC 圧縮フィルター機能はこれら 2 つのタスクを 1 つに結合し、同じタスクで実行します。この機能はデフォルトで有効になっています。1 gc.enable-compaction-filter = false設定することで無効にできます。

TiFlash は、圧縮とデータソートの I/O リソースの使用を制限します (実験的機能)

この機能により、バックグラウンドタスクとフォアグラウンドの読み取りおよび書き込み間の I/O リソースの競合が軽減されます。

この機能はデフォルトでは無効になっています。1 bg_task_io_rate_limit構成項目を変更することで、この機能を有効にすることができます。

大規模クラスター内のスケジュール制約のチェックと不健全なリージョンの修正のパフォーマンスを向上

パフォーマンスのジッタを回避するために、実行プランが可能な限り変更されないようにします。

ユーザードキュメント

SQLバインディングは`INSERT` 、 `REPLACE` 、 `UPDATE` 、 `DELETE`ステートメントをサポートします。

パフォーマンスのチューニングやデータベースのメンテナンスを行う際に、実行プランが不安定なためにシステムのパフォーマンスが不安定になっていることが判明した場合は、ユーザーの判断やEXPLAIN ANALYZEでテストした SQL 文を手動で最適化して選択することができます。最適化された SQL 文をアプリケーションコードで実行する SQL 文にバインドすることで、安定したパフォーマンスを確保できます。

SQL BINDING ステートメントを使用して SQL ステートメントを手動でバインドする場合は、最適化された SQL ステートメントの構文が元の SQL ステートメントと同じであることを確認する必要があります。

SHOW {GLOBAL | SESSION} BINDINGSコマンドを実行すると、手動または自動でバインドされた実行プラン情報を表示できます。出力は、v5.0 より前のバージョンと同じです。

実行プランを自動的にキャプチャしてバインドする

TiDB をアップグレードする場合、パフォーマンスのジッターを回避するために、ベースラインキャプチャ機能を有効にして、システムが最新の実行プランを自動的にキャプチャしてバインドし、システムテーブルに保存できるようにします。TiDB をアップグレードした後、 SHOW GLOBAL BINDINGコマンドを実行してバインドされた実行プランをエクスポートし、これらのプランを削除するかどうかを決定できます。

この機能はデフォルトでは無効になっています。サーバーを変更するか、 tidb_capture_plan_baselinesグローバルシステム変数をONに設定することで有効にできます。この機能を有効にすると、システムはbind-info-lease (デフォルト値は3s ) ごとにステートメントサマリーから少なくとも 2 回表示される SQL ステートメントを取得し、これらの SQL ステートメントを自動的にキャプチャしてバインドします。

TiFlashクエリの安定性を向上

TiFlashが失敗した場合に TiKV にクエリをフォールバックするためのシステム変数tidb_allow_fallback_to_tikvを追加します。デフォルト値はOFFです。

TiCDC の安定性を改善し、増分データの複製が多すぎることによる OOM の問題を軽減します。

ユーザードキュメント , ＃1150

TiCDC v4.0.9 以前のバージョンでは、データ変更を過度に複製すると OOM が発生する可能性があります。v5.0 では、次のシナリオによって発生する OOM の問題を軽減するために、Unified Sorter 機能がデフォルトで有効になっています。

TiCDC のデータ複製タスクは長時間一時停止され、その間に大量の増分データが蓄積され、複製が必要になります。
データ複製タスクは早いタイムスタンプから開始されるため、大量の増分データを複製する必要が生じます。

Unified Sorter は、以前のバージョンのmemory fileエンジンオプションと統合されています。変更を手動で構成する必要はありません。

制限事項:

増分データの量に応じて十分なディスク容量を用意する必要があります。空き容量が 128 GB を超える SSD を使用することをお勧めします。

高可用性と災害復旧

リージョンメンバーシップの変更時のシステム可用性の向上

ユーザードキュメント＃18079 ＃7587 ＃2860

リージョンメンバーシップの変更プロセスでは、「メンバーの追加」と「メンバーの削除」という 2 つの操作が 2 つのステップで実行されます。メンバーシップの変更が完了したときに障害が発生すると、リージョンが使用できなくなり、フォアグラウンドアプリケーションのエラーが返されます。

導入されたRaft Joint Consensus アルゴリズムにより、リージョンメンバーシップの変更時のシステムの可用性が向上します。メンバーシップの変更時の「メンバーの追加」と「メンバーの削除」の操作は 1 つの操作に結合され、すべてのメンバーに送信されます。変更プロセス中、リージョンは中間状態にあります。変更されたメンバーのいずれかに障害が発生した場合でも、システムは引き続き利用可能です。

この機能はデフォルトで有効になっています。 pd-ctl config set enable-joint-consensusコマンドを実行してenable-joint-consensus値をfalseに設定することで無効にできます。

メモリ管理モジュールを最適化してシステムOOMのリスクを軽減する

集計関数のメモリ使用量を追跡します。この機能はデフォルトで有効になっています。集計関数を含む SQL 文が実行されると、現在のクエリの合計メモリ使用量がmem-quota-queryで設定されたしきい値を超えると、システムはoom-actionで定義された操作を自動的に実行します。

ネットワーク分割時のシステム可用性の向上

データ移行

S3/ Auroraから TiDB へのデータの移行

TiDB データ移行ツールは、Amazon S3 (およびその他の S3 互換storageサービス) をデータ移行の中間として使用し、 Auroraスナップショットデータを TiDB に直接初期化することをサポートしており、Amazon S3/ Auroraから TiDB にデータを移行するためのオプションがさらに増えています。

この機能を使用するには、次のドキュメントを参照してください。

TiDB Cloudのデータインポートパフォーマンスを最適化

TiDB Lightning は、特にTiDB Cloudの AWS T1.standard 構成 (または同等) 向けにデータインポートパフォーマンスを最適化します。テスト結果によると、 TiDB Lightningにより、1 TB の TPC-C データを TiDB にインポートする速度が 254 GiB/h から 366 GiB/h に 40% 向上しました。

TiCDC を使用して TiDB を Kafka Connect (Confluent Platform) に統合する (実験的機能)

ユーザードキュメント , ＃660

この機能により、TiDB データを他のシステムにストリーミングするというビジネス要件をサポートするために、TiDB データを Kafka、Hadoop、Oracle などのシステムにストリーミングできるようになります。

Confluent プラットフォームが提供する Kafka コネクタプロトコルはコミュニティで広く使用されており、さまざまなプロトコルでリレーショナルデータベースまたは非リレーショナルデータベースへのデータ転送をサポートしています。TiCDC を Confluent プラットフォームの Kafka Connect に統合することで、TiDB は TiDB データを他の異種データベースまたはシステムにストリーミングする機能を拡張します。

診断

ユーザードキュメント

SQL パフォーマンスの問題のトラブルシューティングでは、パフォーマンスの問題の原因を特定するために詳細な診断情報が必要です。TiDB 5.0 より前では、 EXPLAINステートメントによって収集された情報は十分に詳細ではありませんでした。問題の根本原因は、ログ情報、監視情報、または推測に基づいてのみ特定できるため、非効率的である可能性があります。

TiDB v5.0 では、パフォーマンスの問題をより効率的にトラブルシューティングできるように、次の改善が加えられています。

EXPLAIN ANALYZEステートメントを使用してすべての DML ステートメントを分析し、実際のパフォーマンスプランと各演算子の実行情報を表示することをサポートします＃18056
EXPLAIN FOR CONNECTIONステートメントを使用して、実行中のすべての SQL ステートメントのリアルタイムステータスを確認することをサポートします。たとえば、ステートメントを使用して、各演算子の実行時間や処理された行数を確認できます＃18233
EXPLAIN ANALYZEステートメントの出力で、オペレータによって送信された RPC 要求の数、ロック競合の解決にかかる時間、ネットワークレイテンシー、RocksDB でスキャンされた削除済みデータの量、RocksDB キャッシュのヒット率など、オペレータの実行に関する詳細情報を提供します＃18663
SQL 文の詳細な実行情報をスローログに自動的に記録する機能をサポートします。スローログ内の実行情報は、各演算子の消費時間、処理された行数、送信された RPC 要求の数など、 EXPLAIN ANALYZE文の出力情報と一致します＃15009

導入とメンテナンス

クラスタ展開操作のロジックを最適化し、DBAが標準のTiDB本番クラスタのセットをより迅速に展開できるようにします。

ユーザードキュメント

以前のバージョンの TiDB では、 TiUPを使用して TiDB クラスターを展開する DBA は、環境の初期化が複雑で、チェックサム構成が過剰で、クラスタートポロジファイルの編集が難しいことに気付きました。これらの問題はすべて、DBA の展開効率の低下につながります。TiDB v5.0 では、次の項目により、 TiUPを使用した TiDB 展開の DBA の効率が向上しています。

TiUP クラスタは、より包括的なワンクリック環境チェックを実行し、修復の推奨事項を提供するcheck topo.yamlコマンドをサポートしています。
TiUP クラスタは、環境チェック中に検出された環境の問題を自動的に修復するcheck topo.yaml --applyコマンドをサポートしています。
TiUP クラスタは、DBA が編集してグローバルノードパラメータの変更をサポートするためのクラスタートポロジテンプレートファイルを取得するtemplateコマンドをサポートしています。
TiUP は、リモート Prometheus を構成するためにedit-configコマンドを使用してremote_configパラメータを編集することをサポートしています。
TiUP は、 edit-configコマンドを使用してさまざまな AlertManager を構成するためにexternal_alertmanagersパラメータを編集することをサポートしています。
tiup-clusterのedit-configサブコマンドを使用してトポロジファイルを編集するときに、構成項目の値のデータ型を変更できます。

アップグレードの安定性を向上

TiUP v1.4.0 より前では、 tiup-clusterを使用して TiDB クラスターをアップグレードすると、クラスターの SQL 応答が長時間にわたってジッタし、PD オンラインローリングアップグレード中は、クラスターの QPS が 10 秒から 30 秒の間ジッタします。

TiUP v1.4.0 ではロジックが調整され、次の最適化が行われます。

PD ノードのアップグレード中、 TiUP は再起動された PD ノードのステータスを自動的にチェックし、ステータスが準備完了であることを確認した後、次の PD ノードのアップグレードをロールします。
TiUP はPD ロールを自動的に識別し、最初にフォロワーロールの PD ノードをアップグレードし、最後に PDLeaderノードをアップグレードします。

アップグレード時間を最適化する

TiUP v1.4.0 より前では、DBA がtiup-clusterを使用して TiDB クラスターをアップグレードする場合、多数のノードを持つクラスターでは合計アップグレード時間が長くなり、特定のユーザーのアップグレード時間枠の要件を満たすことができません。

v1.4.0 以降、 TiUP は次の項目を最適化します。

tiup cluster upgrade --offlineサブコマンドを使用した高速オフラインアップグレードをサポートします。
デフォルトで、アップグレード中にローリングアップグレードを使用するユーザーのリージョンLeaderの再配置が高速化されるため、ローリング TiKV アップグレードの時間が短縮されます。
ローリングアップグレードを実行する前に、 checkサブコマンドを使用してリージョンモニターのステータスを確認します。アップグレード前にクラスターが正常な状態であることを確認し、アップグレードが失敗する可能性を減らします。

ブレークポイント機能をサポートする

TiUP v1.4.0 より前では、DBA がtiup-clusterを使用して TiDB クラスターをアップグレードするときに、コマンドの実行が中断されると、すべてのアップグレード操作を最初から再度実行する必要がありました。

TiUP v1.4.0 では、アップグレードの中断後にすべての操作が再実行されるのを回避するために、 tiup-cluster replayサブコマンドを使用してブレークポイントから失敗した操作を再試行することがサポートされています。

保守・運用機能の強化

TiUP v1.4.0 では、TiDB クラスターの操作と保守の機能がさらに強化されています。

より多くの使用シナリオに適応するために、ダウンタイム TiDB および DM クラスターでのアップグレードまたはパッチ操作をサポートします。
クラスターのバージョンを取得するために、 tiup-clusterのdisplayサブコマンドに--versionパラメーターを追加します。
スケールアウトするノードに Prometheus のみが含まれている場合、Prometheus ノードの不在によるスケールアウトの失敗を回避するために、監視構成の更新操作は実行されません。
入力されたTiUPコマンドの結果が正しくない場合に、エラーメッセージにユーザー入力を追加して、問題の原因をより迅速に特定できるようにします。

テレメトリー

TiDB は、データテーブルの数、クエリの数、新しい機能が有効になっているかどうかなど、テレメトリにクラスター使用状況メトリックを追加します。

この動作の詳細と無効にする方法については、テレメトリーを参照してください。

TiDB 5.0 の新機能

互換性の変更

システム変数

コンフィグレーションファイルのパラメータ

その他

新機能

構文

List パーティショニング（Experimental）

List COLUMNS パーティショニング（Experimental）

目に見えないインデックス

EXCEPTおよびINTERSECT演算子

トランザクション

文字セットと照合順序

Security

パフォーマンスの最適化

MPPアーキテクチャ

クラスター化インデックス

非同期コミット

コプロセッサーキャッシュ機能をデフォルトで有効にする

delete from table where id <? Limit ?ステートメントの実行パフォーマンスを向上

ロードベースの分割戦略を最適化して、一部の小さなテーブルのホットスポット読み取りシナリオでデータを分割できないというパフォーマンスの問題を解決します。

安定性の向上

不完全なスケジューリングによって発生するパフォーマンスジッターの問題を最適化します

不要なスケジューリングとパフォーマンスのジッターを削減するための新しいスケジューリング計算式を導入

デフォルトでクロステーブルリージョン結合機能を有効にする

バックグラウンドタスクとフォアグラウンドの読み取りおよび書き込み間のI/Oリソースの競合のバランスをとるために、デフォルトでシステムが自動的にデータ圧縮速度を調整するようにする

GC 圧縮フィルター機能をデフォルトで有効にして、GC による CPU と I/O リソースの消費を削減します。

TiFlash は、圧縮とデータソートの I/O リソースの使用を制限します (実験的機能)

大規模クラスター内のスケジュール制約のチェックと不健全なリージョンの修正のパフォーマンスを向上

パフォーマンスのジッタを回避するために、実行プランが可能な限り変更されないようにします。

SQLバインディングはINSERT 、 REPLACE 、 UPDATE 、 DELETEステートメントをサポートします。

実行プランを自動的にキャプチャしてバインドする

TiFlashクエリの安定性を向上

TiCDC の安定性を改善し、増分データの複製が多すぎることによる OOM の問題を軽減します。

高可用性と災害復旧

リージョンメンバーシップの変更時のシステム可用性の向上

メモリ管理モジュールを最適化してシステムOOMのリスクを軽減する

ネットワーク分割時のシステム可用性の向上

データ移行

S3/ Auroraから TiDB へのデータの移行

TiDB Cloudのデータインポートパフォーマンスを最適化

データの共有とサブスクリプション

TiCDC を使用して TiDB を Kafka Connect (Confluent Platform) に統合する (実験的機能)

診断

導入とメンテナンス

クラスタ展開操作のロジックを最適化し、DBAが標準のTiDB本番クラスタのセットをより迅速に展開できるようにします。

アップグレードの安定性を向上

アップグレード時間を最適化する

ブレークポイント機能をサポートする

保守・運用機能の強化

テレメトリー

このページは役に立ちましたか？

`EXCEPT`および`INTERSECT`演算子

`delete from table where id <? Limit ?`ステートメントの実行パフォーマンスを向上

SQLバインディングは`INSERT` 、 `REPLACE` 、 `UPDATE` 、 `DELETE`ステートメントをサポートします。