重要

このページは英語版のページを機械翻訳しています。原文はこちらからご覧ください。

TiDB TPC-H パフォーマンステストレポート - v4.0 と v3.0 の比較

テスト目的

このテストの目的は、オンライン分析処理 (OLAP) シナリオにおける TiDB 4.0 と TiDB 3.0 の TPC-H パフォーマンスを比較することです。

TiFlash TiDB のハイブリッドトランザクションおよび分析処理 (HTAP) 機能を強化する TiDB v4.0 で導入されたため、このレポートのテストオブジェクトは次のとおりです。

TiKV からのみデータを読み取る TiDB v3.0。
TiKV からのみデータを読み取る TiDB v4.0。
インテリジェントな選択に基づいて TiKV およびTiFlashからデータを自動的に読み取る TiDB v4.0。

テスト環境（AWS EC2）

ハードウェア構成

サービスの種類	EC2タイプ	インスタンス数
PD	m5.特大	3
ティビ	c5.4特大	2
TiKV とTiFlash	i3.4xlarge	3
TPC-H	m5.特大	1

ソフトウェアバージョン

サービスの種類	ソフトウェアバージョン
PD	3.0 と 4.0
ティビ	3.0 と 4.0
ティクヴ	3.0 と 4.0
TiFlash	4.0
tiup-bench	0.2

パラメータ設定

バージョン3.0

v3.0 の場合、TiDB、TiKV、PD はデフォルトのパラメータ構成を使用します。

可変構成

set global tidb_distsql_scan_concurrency = 30;
set global tidb_projection_concurrency = 16;
set global tidb_hashagg_partial_concurrency = 16;
set global tidb_hashagg_final_concurrency = 16;
set global tidb_hash_join_concurrency = 16;
set global tidb_index_lookup_concurrency = 16;
set global tidb_index_lookup_join_concurrency = 16;

バージョン4.0

v4.0 の場合、TiDB はデフォルトのパラメータ構成を使用します。

TiKV 構成

readpool.storage.use-unified-pool: false
readpool.coprocessor.use-unified-pool: true

PD構成

replication.enable-placement-rules: true

TiFlash構成

logger.level: "info"
learner_config.log-level: "info"

可変構成

注記：
セッション変数が存在する可能性があります。すべてのクエリを現在のセッションで実行することをお勧めします。

set global tidb_allow_batch_cop = 1;
set session tidb_opt_distinct_agg_push_down = 1;
set global tidb_distsql_scan_concurrency = 30;
set global tidb_projection_concurrency = 16;
set global tidb_hashagg_partial_concurrency = 16;
set global tidb_hashagg_final_concurrency = 16;
set global tidb_hash_join_concurrency = 16;
set global tidb_index_lookup_concurrency = 16;
set global tidb_index_lookup_join_concurrency = 16;

テスト計画

ハードウェアの前提条件

ディスクと I/O リソースに対する TiKV とTiFlash の競合を回避するには、EC2 に設定された 2 つの NVMe SSD ディスクを/data1と/data2にマウントします。5 /data1 TiKV をデプロイ、 /data2にTiFlashをデプロイします。

テストプロセス

TiUPを使用して TiDB v4.0 および v3.0をデプロイ。

TiUPのベンチツールを使用して、スケール係数 10 で TPC-H データをインポートします。

データを v3.0 にインポートするには、次のコマンドを実行します。

tiup bench tpch prepare \
--host ${tidb_v3_host} --port ${tidb_v3_port} --db tpch_10 \
--sf 10 \
--analyze --tidb_build_stats_concurrency 8 --tidb_distsql_scan_concurrency 30

データを v4.0 にインポートするには、次のコマンドを実行します。

tiup bench tpch prepare \
  --host ${tidb_v4_host} --port ${tidb_v4_port} --db tpch_10 --password ${password} \
  --sf 10 \
  --tiflash \
  --analyze --tidb_build_stats_concurrency 8 --tidb_distsql_scan_concurrency 30

TPC-H クエリを実行します。
1. TPC-H SQL クエリファイルをダウンロードします。
```
git clone https://github.com/pingcap/tidb-bench.git && cd tpch/queries
```
2. TPC-H クエリを実行し、各クエリの実行時間を記録します。
  - TiDB v3.0 の場合、MySQL クライアントを使用して TiDB に接続し、クエリを実行し、各クエリの実行時間を記録します。
  - TiDB v4.0 の場合、MySQL クライアントを使用して TiDB に接続し、データの読み取り元に基づいて次のいずれかの操作を選択します。
    - データが TiKV からのみ読み取られる場合は、 set @@session.tidb_isolation_read_engines = 'tikv,tidb';設定し、クエリを実行して、各クエリの実行時間を記録します。
    - コストベースのインテリジェントな選択に基づいて TiKV およびTiFlashからデータが自動的に読み取られる場合は、 set @@session.tidb_isolation_read_engines = 'tikv,tiflash,tidb';設定し、クエリを実行して、各クエリの実行時間を記録します。
クエリ実行時間のデータを抽出して整理します。

テスト結果

注記：
このテストで SQL 文が実行されるテーブルには主キーのみがあり、セカンダリインデックスはありません。そのため、以下のテスト結果はインデックスの影響を受けません。

クエリID	バージョン3.0	v4.0 TiKVのみ	v4.0 TiKV/ TiFlash自動
1	7.78秒	7.45秒	2.09秒
2	3.15秒	1.71秒	1.71秒
3	6.61秒	4.10秒	4.05秒
4	2.98秒	2.56秒	1.87秒
5	20.35秒	5.71秒	8.53秒
6	4.75秒	2.44秒	0.39秒
7	7.97秒	3.72秒	3.59秒
8	5.89秒	3.22秒	8.59秒
9	34.08秒	11.87秒	15.41秒
10	4.83秒	2.75秒	3.35秒
11	3.98秒	1.60秒	1.59秒
12	5.63秒	3.40秒	1.03秒
13	5.41秒	4.56秒	4.02秒
14	5.19秒	3.10秒	0.78秒
15	10.25秒	1.82秒	1.26秒
16	2.46秒	1.51秒	1.58秒
17	23.76秒	12.38秒	8.52秒
18	17.14秒	16.38秒	16.06秒
19	5.70秒	4.59秒	3.20秒
20	4.98秒	1.89秒	1.29秒
21	11.12秒	6.23秒	6.26秒
22	4.49秒	3.05秒	2.31秒

TPC-H

上記のパフォーマンス図では、

青い線は v3.0 を表します。
赤い線は v4.0 (TiKV からのみ読み取られたデータ) を表します。
黄色の線は v4.0 (インテリジェントな選択に基づいて TiKV およびTiFlashから自動的に読み取られたデータ) を表します。
Y 軸はクエリの実行時間を表します。時間が短いほど、パフォーマンスは向上します。

結果の説明:

v4.0 TiKV Only は、TiDB が TiKV からのみデータを読み取ることを意味します。結果は、TiDB と TiKV が v4.0 にアップグレードされた後に TPC-H パフォーマンスが向上したことを示しています。
v4.0 TiKV/ TiFlash Automatically は、 TiDB オプティマイザーがコスト見積もりに従ってTiFlashレプリカからデータを読み取るかどうかを自動的に決定することを意味します。結果は、v4.0 の完全な HTAP 形式で TPC-H パフォーマンスが向上したことを示しています。

上の図から、22 のクエリセット全体で TPC-H のパフォーマンスが平均で約 100% 向上していることがわかります。

TiDB TPC-H パフォーマンス テスト レポート - v4.0 と v3.0 の比較

テスト目的

テスト環境（AWS EC2）

ハードウェア構成

ソフトウェアバージョン

パラメータ設定

バージョン3.0

可変構成

バージョン4.0

TiKV 構成

PD構成

TiFlash構成

可変構成

テスト計画

ハードウェアの前提条件

テストプロセス

テスト結果

このページは役に立ちましたか？

TiDB TPC-H パフォーマンステストレポート - v4.0 と v3.0 の比較