TiDB 3.0 GA リリースノート
発売日:2019年6月28日
TiDB バージョン: 3.0.0
TiDB Ansible バージョン: 3.0.0
概要
2019年6月28日にTiDB 3.0 GAがリリースされました。対応するTiDB Ansibleバージョンは3.0.0です。このリリースでは、TiDB 2.1と比較して、以下の点が大幅に改善されています。
- 安定性。TiDB 3.0 は、最大 150 以上のノードと 300 TB 以上のstorageを備えた大規模クラスターで長期的な安定性を実証しています。
- 使いやすさ。TiDB 3.0 では、標準化されたスロー クエリ ログ、十分に開発されたログ ファイル仕様、ユーザーの操作コストを削減する
EXPLAIN ANALYZEや SQL トレースなどの新機能など、使いやすさが多面的に向上しています。 - パフォーマンス。TiDB 3.0のパフォーマンスは、TPC-CベンチマークではTiDB 2.1の4.5倍、Sysbenchベンチマークでは1.5倍以上です。Viewsのサポートにより、TPC-H 50G Q15は正常に動作できるようになりました。
- 新しい機能には、ウィンドウ関数、ビュー (Experimental)、パーティション テーブル、プラグイン フレームワーク、悲観的ロック (Experimental)、および
SQL Plan Management含まれます。
TiDB
- 新機能
- ウィンドウ関数
NTH_VALUERANK。1、3、5、7、9、11、13、15、17、19、21LEAD含むMySQL 8.0NTILEすべてのCUME_DIST関数ROW_NUMBERLAST_VALUEFIRST_VALUEPERCENT_RANKありDENSE_RANKLAG - ビューのサポート(Experimental)
- テーブルパーティションの改善
- サポート範囲パーティション
- ハッシュパーティションをサポート
- IP ホワイトリスト (エンタープライズ) や監査ログ (エンタープライズ) などのプラグインをサポートするプラグイン フレームワークを追加します。
- クエリの安定性を確保するために SQL 実行プラン バインディングを作成する SQL プラン管理機能をサポートします (Experimental)
- ウィンドウ関数
- SQLオプティマイザー
NOT EXISTSサブクエリを最適化し、Anti Semi Joinに変換してパフォーマンスを向上させますOuter Joinの定数伝播を最適化し、Outer Join除去の最適化ルールを追加して、効果のない計算を減らし、パフォーマンスを向上させます。- パフォーマンスを向上させるために、集計後に
INサブクエリをInner Join実行するように最適化します。 Index Join最適化してより多くのシナリオに適応する- レンジパーティションのパーティションプルーニング最適化ルールの改善
_tidb_rowidのクエリロジックを最適化して、テーブル全体のスキャンを回避し、パフォーマンスを向上させます。- 複合インデックスのアクセス条件を抽出する際に、フィルタ内に関連する列がある場合に、インデックスのプレフィックス列をさらに一致させてパフォーマンスを向上します。
- 列間の順序相関を利用してコスト見積りの精度を向上させる
- 貪欲戦略と動的計画法アルゴリズムに基づいて
Join Order最適化し、複数のテーブルの結合操作を高速化します。 - クエリの安定性を向上させるために、実行プランが統計に過度に依存しないようにするためのルールを備えたスカイラインプルーニングをサポートします。
- NULL値を持つ単一列インデックスの行数推定の精度を向上
- 各リージョンでランダムにサンプリングしてテーブル全体のスキャンを回避し、統計収集のパフォーマンスを向上させるサポート
FAST ANALYZE - 統計収集のパフォーマンスを向上させるために、単調に増加するインデックス列に対する増分分析操作をサポートします。
DO文でサブクエリの使用をサポート- トランザクションで
Index Join使用をサポート - パラメータのないDDL文をサポートするために
prepareexecute最適化します stats-lease変数値が0の場合に統計を自動的にロードするようにシステムの動作を変更します- 履歴統計のエクスポートをサポート
- ヒストグラムの
dump相関loadサポート
- SQL実行エンジン
- ログ出力を最適化:
EXECUTEユーザー変数を出力し、COMMITトラブルシューティングを容易にするためにスロークエリログを出力します。 - SQLチューニングの使いやすさを向上させる
EXPLAIN ANALYZE機能をサポート - 次の行のIDを取得するための
admin show next_row_idコマンドをサポートします - 6
NAME_CONSTJSON_ARRAY_APPEND組み込み関数BENCHMARK追加しCOALESCEJSON_MERGE_PRESERVEJSON_QUOTE - チャンクサイズの制御ロジックを最適化し、クエリコンテキストに基づいて動的に調整することで、SQL実行時間とリソース消費を削減します。
- 3つの演算子(
TableReaderIndexLookupReaderでメモリ使用量の追跡と制御をサポートしますIndexReader - 空の
ON条件をサポートするように Merge Join 演算子を最適化します。 - 列が多すぎる単一テーブルの書き込みパフォーマンスを最適化します
- 逆順でデータをスキャンできるようにすることで
admin show ddl jobsのパフォーマンスを向上します - ホットスポットの問題を軽減するために、テーブルリージョンを手動で分割する
split table regionステートメントを追加します。 - ホットスポットの問題を軽減するために、インデックスリージョンを手動で分割する
split index regionステートメントを追加します。 - コプロセッサーへの式のプッシュダウンを禁止するブロックリストを追加します
- 実行時間またはメモリの設定された制限を超えたときにSQLクエリをログに出力するように
Expensive Queryログを最適化します。
- ログ出力を最適化:
- DDL
- 文字セット
utf8からutf8mb4への移行をサポート - デフォルトの文字セットを
utf8からutf8mb4に変更します alter schema文を追加して、データベースの文字セットと照合順序を変更します。- ALTERアルゴリズム
INSTANTサポートINPLACE - サポート
SHOW CREATE VIEW - サポート
SHOW CREATE USER - 誤って削除されたテーブルの高速回復をサポート
- ADD INDEX の同時実行数を動的に調整する機能をサポート
CREATE TABLEステートメントを使用してテーブルを作成するときに、領域を事前に割り当てるpre_split_regionsオプションを追加して、テーブル作成後の大量の書き込みによって発生する書き込みホット領域を軽減します。- ホットスポットの問題を軽減するために、SQL ステートメントを使用して指定されたテーブルのインデックスと範囲でリージョンを分割することをサポートします。
- DDLタスクの再試行回数を制限するために
ddl_error_count_limitグローバル変数を追加します。 - ホットスポットの問題を軽減するために、列に AUTO_INCREMENT 属性が含まれている場合に行 ID を分散するために
SHARD_ROW_ID_BITS使用する機能を追加します。 - 無効な DDL メタデータの有効期間を最適化して、TiDB クラスタのアップグレード後に DDL 操作の通常の実行を回復する速度を向上します。
- 文字セット
- 取引
- 悲観的トランザクションモードをサポート(Experimental)
- より多くのシナリオに適応するためにトランザクション処理ロジックを最適化します。
- デフォルト値の
tidb_disable_txn_auto_retryをonに変更します。これは、自動コミットされないトランザクションは再試行されないことを意味します。 tidb_batch_commitシステム変数を追加して、トランザクションを複数のトランザクションに分割し、同時に実行します。tidb_low_resolution_tsoシステム変数を追加して、バッチで取得する TSO の数を制御し、トランザクションが TSO を要求する回数を減らし、一貫性の要件が比較的低いシナリオでのパフォーマンスを向上させます。- 分離レベルがSERIALIZABLEに設定されている場合にエラーを報告するかどうかを制御する
tidb_skip_isolation_level_check変数を追加します。 tidb_disable_txn_auto_retryシステム変数を変更して、再試行可能なすべてのエラーで機能するようにします。
- デフォルト値の
- 権限管理
ANALYZEUSEステートメントSET GLOBAL権限チェックSHOW PROCESSLIST実行する- ロールベースのアクセス制御 (RBAC) をサポート (Experimental)
- サーバ
- 遅いクエリ ログを最適化します。
- ログ形式の再構築
- ログの内容を最適化する
- メモリテーブルの
INFORMATION_SCHEMA.SLOW_QUERYとADMIN SHOW SLOWステートメントを使用してスロー クエリ ログをクエリできるように、ログ クエリ メソッドを最適化します。
- ツールによる収集と分析を容易にするために、ログシステムを再構築し、統一されたログフォーマット仕様を開発する
- ステータスのクエリ、TiDB Binlog の有効化、TiDB Binlog戦略の維持と送信など、SQL ステートメントを使用した TiDB Binlogサービスの管理をサポートします。
unix_socket使用してデータベースに接続することをサポートします- SQL文のサポート
Trace - トラブルシューティングを容易にするために、
/debug/zipHTTP インターフェースを介して TiDB インスタンスの情報を取得することをサポートします。 - トラブルシューティングを容易にするために監視項目を最適化します。
- 統計に基づいて実際のデータ量と推定データ量の差を監視するための監視項目を
high_error_rate_feedback_total追加します。 - データベースディメンションにQPS監視項目を追加する
- 統計に基づいて実際のデータ量と推定データ量の差を監視するための監視項目を
- システム初期化プロセスを最適化し、DDL所有者のみが初期化を実行できるようにします。これにより、初期化やアップグレードの起動時間が短縮されます。
kill queryの実行ロジックを最適化してパフォーマンスを向上させ、リソースが適切に解放されるようにします。- 設定ファイルの有効性をチェックするための起動オプション
config-checkを追加します - 内部エラー再試行のバックオフ時間を制御するシステム変数
tidb_back_off_weight追加します wait_timeoutとinteractive_timeoutシステム変数を追加して、許可されるアイドル接続の最大数を制御しましょう。- 接続確立時間を短縮するために、TiKV の接続プールを追加します。
- 遅いクエリ ログを最適化します。
- 互換性
ALLOW_INVALID_DATESSQLモードをサポート- MySQL 320ハンドシェイクプロトコルをサポート
- 符号なし BIGINT 列を自動インクリメント列として表示することをサポート
SHOW CREATE DATABASE IF NOT EXISTS構文をサポートする- CSVファイルのフォールトトレランス
load data最適化 - フィルタリング条件にユーザー変数が含まれている場合、述語プッシュダウン操作を中止して、ユーザー変数を使用してウィンドウ関数をシミュレートするMySQLの動作との互換性を向上させます。
PD
- 単一ノードからのクラスターの再作成をサポート
- 大規模クラスタのetcdのstorageボトルネックを解決するために、リージョンメタデータをetcdからgo-leveldbstorageエンジンに移行します。
- API
- トゥームストーンストアをクリアするための
remove-tombstoneAPI を追加します - リージョン情報を一括クエリするAPI
ScanRegionsを追加 - 実行中の演算子を照会するための
GetOperatorAPI を追加します GetStoresAPIのパフォーマンスを最適化
- トゥームストーンストアをクリアするための
- 構成
- 構成チェックロジックを最適化して構成項目のエラーを回避する
- リージョンの結合方向を制御するには
enable-two-way-merge追加します - ホットリージョンのスケジュールレートを制御するには
hot-region-schedule-limit追加します - 複数のしきい値を連続して超える場合は、ホットスポットを識別するために
hot-region-cache-hits-threshold追加します。 - 1 分あたりに許可されるバランスリージョンオペレータの最大数を制御するための
store-balance-rate構成項目を追加します。
- スケジューラの最適化
- 各店舗のオペレーターの速度を個別に制御するための店舗制限メカニズムを追加します。
- 異なるスケジューラ間のリソース競合を最適化するために
waitingOperatorキューをサポートします。 - スケジューリングレート制限をサポートし、TiKVにスケジューリング操作を積極的に送信します。これにより、単一ノード上で同時に実行されるスケジューリングタスクの数を制限することで、スケジューリングレートが向上します。
- 制限機構に制約されないよう
Region Scatterスケジュールを最適化する - ホットスポットのスケジュールが不十分なシナリオで TiKV の安定性テストを容易にするために
shuffle-hot-regionスケジューラを追加します。
- シミュレーター
- データインポートシナリオのシミュレーターを追加する
- ストアの異なるハートビート間隔の設定をサポート
- その他
- etcd をアップグレードして、ログ出力形式の不一致、事前投票でのLeader選択の失敗、リースのデッドロックの問題を解決します。
- ツールによる収集と分析を容易にするために、ログシステムを再構築し、統一されたログフォーマット仕様を開発する
- スケジュール パラメータ、クラスター ラベル情報、TSO 要求、ストア ID、アドレス情報を処理するために PD が消費した時間などの監視メトリックを追加します。
TiKV
- 分散GCと同時ロック解決をサポートし、GCパフォーマンスを向上
- サポートは
raw_scanとraw_batch_scan逆転 - マルチスレッドRaftstoreとマルチスレッドApplyをサポートし、スケーラビリティ、同時実行能力、単一ノード内のリソース使用率を向上させます。同じ負荷レベルでパフォーマンスが70%向上します。
- Raftメッセージのバッチ受信と送信をサポートし、書き込み集中型のシナリオで TPS を 7% 向上します。
- 書き込み停止を回避するために、スナップショットを適用する前に RocksDB レベル 0 ファイルのチェックをサポートします。
- 1KiBを超える値のサイズでの書き込みパフォーマンスを向上させ、ある程度の書き込み増幅を軽減するキー値プラグインであるTitanを導入します。
- 悲観的トランザクションモードをサポート(Experimental)
- HTTP経由で監視情報を取得することをサポート
Insertのセマンティクスを変更して、キーがない場合にのみ Prewrite が成功するようにします。- ツールによる収集と分析を容易にするために、ログシステムを再構築し、統一されたログフォーマット仕様を開発する
- 構成情報とキー境界の交差に関連するパフォーマンスメトリックを追加します
- パフォーマンス向上のため、RawKV のローカルリーダーをサポート
- エンジン
- メモリ管理を最適化してメモリ割り当てとコピーを削減
Iterator Key Bound Option - 異なる列ファミリー間での
block cache共有をサポート
- メモリ管理を最適化してメモリ割り当てとコピーを削減
- サーバ
- コンテキストスイッチのオーバーヘッドを
batch commandsから削減 txn scheduler削除read indexとGC workerに関連する監視項目を追加する
- コンテキストスイッチのオーバーヘッドを
- ラフトストア
- RaftStore からの CPU 消費を最適化するために Hibernate Regions をサポートします (Experimental)
- ローカルリーダースレッドを削除する
- コプロセッサー
- 計算フレームワークをリファクタリングして、ベクトル演算子、ベクトル式を使用した計算、ベクトル集計を実装し、パフォーマンスを向上させます。
- TiDB の
EXPLAIN ANALYZEステートメントに対する演算子実行ステータスの提供をサポート - コンテキストスイッチのコストを削減するために
work-stealingスレッド プール モデルに切り替える
ツール
- TiDB Lightning
- データテーブルのリダイレクトされたレプリケーションをサポート
- CSVファイルのインポートをサポート
- SQLからKVペアへの変換パフォーマンスの向上
- パフォーマンスを向上させるために、単一テーブルのバッチインポートをサポートします。
- TiKVインポーターのパフォーマンスを向上させるために、大きなテーブルのデータとインデックスを個別にインポートすることをサポートします。
- 新しいファイルに列データが欠落している場合、
row_idまたはデフォルトの列値を使用して欠落している列を埋めることをサポートします。 - SST ファイルを TiKV にアップロードする際の速度制限を
TIKV-importerに設定できるようになりました
- TiDBBinlog
- コンテナ環境でブリッジモードをサポートするために、 Drainerに
advertise-addr構成を追加します。 - トランザクションステータスのクエリを高速化するために、 Pumpに
GetMvccByEncodeKey関数を追加します。 - コンポーネント間の通信データの圧縮をサポートし、ネットワークリソースの消費を削減します。
- Kafka からbinlogを読み取り、データを MySQL に複製する Arbiter ツールを追加します。
- Reparoによるレプリケーションを必要としないファイルのフィルタリングをサポート
- 生成された列の複製をサポート
- 異なるSQLモードを使用してDDLクエリを解析できるように、
syncer.sql-mode構成項目を追加します。 - 複製されないテーブルのフィルタリングをサポートするために
syncer.ignore-table構成項目を追加します
- コンテナ環境でブリッジモードをサポートするために、 Drainerに
- 同期差分インスペクター
- チェックポイントをサポートし、検証ステータスを記録し、再起動後に最後に保存したポイントから検証を続行します。
- チェックサムを計算してデータの整合性をチェックするための
only-use-checksum構成項目を追加します。 - より多くのシナリオに適応するために、TiDB 統計と複数の列を使用して比較用にチャンクを分割する機能をサポートします。
TiDB アンシブル
- 次の監視コンポーネントを安定バージョンにアップグレードします。
- Prometheus V2.2.1 から V2.8.1 へ
- Pushgateway V0.4.0 から V0.7.0 へ
- Node_exporter V0.15.2 から V0.17.0 へ
- Alertmanager V0.14.0 から V0.17.0 へ
- Grafana V4.6.3 から V6.1.6 へ
- Ansible V2.5.14 から V2.7.11 へ
- TiKVサマリー監視ダッシュボードを追加して、クラスターのステータスを簡単に表示します。
- 重複した項目を削除し、トラブルシューティングを容易にするために、TiKV トラブルシューティング監視ダッシュボードを追加します。
- デバッグとトラブルシューティングを容易にするために、TiKV の詳細監視ダッシュボードを追加します。
- ローリングアップデート中にバージョン整合性の同時チェックを追加して、アップデートのパフォーマンスを向上します。
- TiDB Lightningの導入と運用をサポート
table-regions.pyスクリプトを最適化して、Leader分布をテーブルごとに表示できるようにしました。- TiDB 監視を最適化し、SQL カテゴリ別にレイテンシー関連の監視項目を追加します。
- オペレーティング システムのバージョン制限を変更し、CentOS 7.0+ および Red Hat 7.0+ オペレーティング システムのみをサポートするようになりました。
- クラスターの最大 QPS を予測するための監視項目を追加します (デフォルトでは非表示)