重要

このページは英語版のページを機械翻訳しています。原文はこちらからご覧ください。

TiSpark ユーザーガイド

TiSpark architecture

TiSpark vs TiFlash

ティスパーク、複雑な OLAP クエリに答えるために、TiDB/TiKV 上で Apache Spark を実行するために構築されたシンレイヤーです。 Spark プラットフォームと分散 TiKV クラスターの両方の利点を活用し、分散 OLTP データベースである TiDB にシームレスに接続して、オンライントランザクションと分析の両方のワンストップソリューションとして機能するハイブリッドトランザクション/分析処理 (HTAP) ソリューションを提供します。。

TiFlashは、HTAP を有効にする別のツールです。 TiFlashと TiSpark ではどちらも、複数のホストを使用して OLTP データに対して OLAP クエリを実行できます。 TiFlash はデータを列形式で保存するため、より効率的な分析クエリが可能になります。 TiFlashと TiSpark は併用できます。

タイスパークとは

TiSpark は TiKV クラスターと PD クラスターに依存します。 Spark クラスターをセットアップする必要もあります。このドキュメントでは、TiSpark のセットアップ方法と使用方法について簡単に説明します。 Apache Spark の基本的な知識が必要です。詳細については、 Apache Spark Web サイトを参照してください。

Spark Catalyst Engine と緊密に統合されている TiSpark は、コンピューティングを正確に制御します。これにより、Spark は TiKV からデータを効率的に読み取ることができます。 TiSpark はインデックスシークもサポートしており、高速なポイントクエリを可能にします。 TiSpark は、コンピューティングを TiKV にプッシュすることでデータクエリを高速化し、Spark SQL によって処理されるデータ量を削減します。一方、TiSpark は、TiDB の組み込み統計を使用して、最適なクエリプランを選択できます。

TiSpark と TiDB を使用すると、ETL を構築および保守することなく、トランザクションタスクと分析タスクの両方を同じプラットフォーム上で実行できます。これにより、システムアーキテクチャが簡素化され、メンテナンスのコストが削減されます。

TiDB でのデータ処理には、Spark エコシステムのツールを使用できます。

TiSpark: データ分析と ETL
TiKV: データの取得
スケジュールシステム: レポート生成

また、TiSpark は TiKV への分散書き込みをサポートします。 Spark および JDBC を使用した TiDB への書き込みと比較して、TiKV への分散書き込みはトランザクション (すべてのデータの書き込みが成功するか、すべての書き込みが失敗するか) を実装でき、書き込みが高速になります。

警告

TiSpark は TiKV に直接アクセスするため、TiDB サーバーで使用されるアクセス制御メカニズムは TiSpark には適用できません。 TiSpark v2.5.0 以降、TiSpark はユーザー認証と認可をサポートしています。詳細については、 Securityを参照してください。

要件

TiSpark は Spark 以降 2.3 をサポートします。
TiSpark には JDK 1.8 および Scala 2.11/2.12 が必要です。
TiSpark は、 YARN 、 Mesos 、 Standaloneなどの任意の Spark モードで実行されます。

Spark の推奨展開構成

警告

この博士で説明されているTiUP を使用した TiSpark の導入は非推奨になりました。

TiSpark は Spark の TiDB コネクタであるため、これを使用するには、実行中の Spark クラスターが必要です。

このドキュメントでは、Spark のデプロイに関する基本的なアドバイスを提供します。ハードウェアの推奨事項の詳細については、スパーク公式サイトを参照してください。

Spark クラスターの独立したデプロイメントの場合:

Spark には 32 GB のメモリを割り当てることをお勧めします。オペレーティングシステムとバッファキャッシュ用にメモリの少なくとも 25% を予約します。
Spark にはマシンごとに少なくとも 8 ～ 16 コアをプロビジョニングすることをお勧めします。まず、すべての CPU コアを Spark に割り当てる必要があります。

以下はspark-env.sh構成に基づく例です。

SPARK_EXECUTOR_MEMORY = 32g
SPARK_WORKER_MEMORY = 32g
SPARK_WORKER_CORES = 8

TiSpark を入手

TiSpark は、TiKV の読み取りおよび書き込み機能を提供する Spark 用のサードパーティ jar パッケージです。

mysql-connector-j を取得する

mysql-connector-java依存関係は、GPL ライセンスの制限により提供されなくなりました。

TiSpark の jar の次のバージョンには、 mysql-connector-java含まれなくなります。

TiSpark > 3.0.1
TiSpark > 2.5.1 (TiSpark 2.5.x 用)
TiSpark > 2.4.3 (TiSpark 2.4.x 用)

ただし、TiSpark は書き込みと認証にmysql-connector-java必要です。このような場合は、次のいずれかの方法を使用してmysql-connector-java手動でインポートする必要があります。

Spark jar ファイルにmysql-connector-javaを入れます。
Spark ジョブを送信するときにmysql-connector-javaインポートします。次の例を参照してください。

spark-submit --jars tispark-assembly-3.0_2.12-3.1.0-SNAPSHOT.jar,mysql-connector-java-8.0.29.jar

TiSpark のバージョンを選択してください

TiDB と Spark のバージョンに応じて、TiSpark のバージョンを選択できます。

TiSparkのバージョン	TiDB、TiKV、PD バージョン	スパークバージョン	スカラ版
2.4.x-scala_2.11	5.x、4.x	2.3.x、2.4.x	2.11
2.4.x-scala_2.12	5.x、4.x	2.4.x	2.12
2.5.x	5.x、4.x	3.0.x、3.1.x	2.12
3.0.x	5.x、4.x	3.0.x、3.1.x、3.2.x	2.12
3.1.x	6.x、5.x、4.x	3.0.x、3.1.x、3.2.x、3.3.x	2.12

TiSpark 2.4.4、2.5.2、3.0.2、および 3.1.1 は最新の安定バージョンであり、強く推奨されます。

TiSpark の瓶を入手する

TiSpark jar は、次のいずれかの方法を使用して取得できます。

メイブンセントラルから取得してpingcapを検索
TiSpark リリースから取得
以下の手順でソースからビルドします。

注記：
現在、TiSpark をビルドするには java8 が唯一の選択肢であり、 mvn -version を実行して確認してください。

git clone https://github.com/pingcap/tispark.git

TiSpark ルートディレクトリで次のコマンドを実行します。

// add -Dmaven.test.skip=true to skip the tests
mvn clean install -Dmaven.test.skip=true
// or you can add properties to specify spark version
mvn clean install -Dmaven.test.skip=true -Pspark3.2.1

TiSpark jar のアーティファクト ID

TiSpark のアーティファクト ID は、TiSpark のバージョンによって異なります。

TiSparkのバージョン	アーティファクトID
2.4.x-${scala_version}、2.5.0	ティスパークアセンブリ
2.5.1	tispark-assembly-${spark_version}
3.0.x、3.1.x	tispark-assembly- ${spark_version}-$ {scala_version}

はじめる

このドキュメントでは、Spark-Shell で TiSpark を使用する方法について説明します。

スパークシェルを開始する

スパークシェルで TiSpark を使用するには:

spark-defaults.confに次の構成を追加します。

spark.sql.extensions  org.apache.spark.sql.TiExtensions
spark.tispark.pd.addresses  ${your_pd_adress}
spark.sql.catalog.tidb_catalog  org.apache.spark.sql.catalyst.catalog.TiCatalog
spark.sql.catalog.tidb_catalog.pd.addresses  ${your_pd_adress}

--jarsオプションを指定して Spark-Shell を開始します。

spark-shell --jars tispark-assembly-{version}.jar

TiSpark バージョンを取得する

TiSpark のバージョン情報を取得するには、spark-shell で次のコマンドを実行します。

spark.sql("select ti_version()").collect

TiSpark を使用してデータを読み取る

Spark SQL を使用して TiKV からデータを読み取ることができます。

spark.sql("use tidb_catalog")
spark.sql("select count(*) from ${database}.${table}").show

TiSpark を使用してデータを書き込む

Spark DataSource API を使用して、 ACIDが保証されている TiKV にデータを書き込むことができます。

val tidbOptions: Map[String, String] = Map(
  "tidb.addr" -> "127.0.0.1",
  "tidb.password" -> "",
  "tidb.port" -> "4000",
  "tidb.user" -> "root"
)

val customerDF = spark.sql("select * from customer limit 100000")

customerDF.write
.format("tidb")
.option("database", "tpch_test")
.option("table", "cust_test_select")
.options(tidbOptions)
.mode("append")
.save()

詳細についてはデータソースAPIユーザーガイド参照してください。

TiSpark 3.1 以降は Spark SQL を使用して記述することもできます。詳細についてはSQLを挿入参照してください。

JDBC データソースを使用してデータを書き込む

TiSpark を使用せずに、Spark JDBC を使用して TiDB に書き込むこともできます。

これは TiSpark の範囲を超えています。このドキュメントでは例のみを示します。詳細については、 JDBC から他のデータベースへを参照してください。

import org.apache.spark.sql.execution.datasources.jdbc.JDBCOptions

val customer = spark.sql("select * from customer limit 100000")
// you might need to repartition the source to make it balanced across nodes
// and increase concurrency
val df = customer.repartition(32)
df.write
.mode(saveMode = "append")
.format("jdbc")
.option("driver", "com.mysql.jdbc.Driver")
 // replace the host and port with yours and be sure to use rewrite batch
.option("url", "jdbc:mysql://127.0.0.1:4000/test?rewriteBatchedStatements=true")
.option("useSSL", "false")
// as tested, setting to `150` is a good practice
.option(JDBCOptions.JDBC_BATCH_INSERT_SIZE, 150)
.option("dbtable", s"cust_test_select") // database name and table name here
.option("isolationLevel", "NONE") // set isolationLevel to NONE
.option("user", "root") // TiDB user here
.save()

TiDB OOM につながる可能性のある大きな単一トランザクションを回避し、 ISOLATION LEVEL does not supportエラーも回避するには、 isolationLevelからNONEに設定します (TiDB は現在REPEATABLE-READのみをサポートします)。

TiSparkを使用してデータを削除する

Spark SQL を使用して、TiKV からデータを削除できます。

spark.sql("use tidb_catalog")
spark.sql("delete from ${database}.${table} where xxx")

詳細については機能の削除参照してください。

他のデータソースを操作する

次のように、複数のカタログを使用して、さまざまなデータソースからデータを読み取ることができます。

// Read from Hive
spark.sql("select * from spark_catalog.default.t").show

// Join Hive tables and TiDB tables
spark.sql("select t1.id,t2.id from spark_catalog.default.t t1 left join tidb_catalog.test.t t2").show

TiSpark 構成

次の表の構成は、 spark-defaults.confでまとめるか、他の Spark 構成プロパティと同じ方法で渡すことができます。

鍵	デフォルト値	説明
`spark.tispark.pd.addresses`	`127.0.0.1:2379`	カンマで区切られた PD クラスターのアドレス。
`spark.tispark.grpc.framesize`	`2147483647`	gRPC 応答の最大フレームサイズ (バイト単位) (デフォルトは 2G)。
`spark.tispark.grpc.timeout_in_sec`	`10`	gRPC タイムアウト時間 (秒単位)。
`spark.tispark.plan.allow_agg_pushdown`	`true`	アグリゲーションが TiKV にプッシュダウンできるかどうか (ビジーな TiKV ノードの場合)。
`spark.tispark.plan.allow_index_read`	`true`	計画時にインデックスが有効になっているかどうか (TiKV に大きな負荷がかかる可能性があります)。
`spark.tispark.index.scan_batch_size`	`20000`	同時インデックススキャンのバッチ内の行キーの数。
`spark.tispark.index.scan_concurrency`	`5`	行キーを取得するインデックススキャンのスレッドの最大数 (各 JVM 内のタスク間で共有)。
`spark.tispark.table.scan_concurrency`	`512`	テーブルスキャンのスレッドの最大数 (各 JVM 内のタスク間で共有)。
`spark.tispark.request.command.priority`	`Low`	値のオプションは`Low` 、 `Normal` 、 `High`です。この設定は、TiKV に割り当てられるリソースに影響します。 OLTP ワークロードが妨げられないため、 `Low`をお勧めします。
`spark.tispark.coprocess.codec_format`	`chblock`	コプロセッサーのデフォルトのコーデック形式を保持します。使用可能なオプションは`default` 、 `chblock` 、および`chunk`です。
`spark.tispark.coprocess.streaming`	`false`	応答の取得にストリーミングを使用するかどうか (実験的)。
`spark.tispark.plan.unsupported_pushdown_exprs`		カンマで区切られた式のリスト。非常に古いバージョンの TiKV を使用している場合、サポートされていない一部の式のプッシュダウンを無効にすることができます。
`spark.tispark.plan.downgrade.index_threshold`	`1000000000`	1 つのリージョンのインデックススキャンのリージョンが元のリクエストでこの制限を超えている場合は、このリージョンのリクエストを計画されたインデックススキャンではなくテーブルスキャンにダウングレードします。デフォルトでは、ダウングレードは無効になっています。
`spark.tispark.show_rowid`	`false`	ID が存在する場合に行 ID を表示するかどうか。
`spark.tispark.db_prefix`		TiDB 内のすべてのデータベースの追加のプレフィックスを示す文字列。この文字列は、TiDB 内のデータベースと同じ名前の Hive データベースを区別します。
`spark.tispark.request.isolation.level`	`SI`	基礎となる TiDB クラスターのロックを解決するかどうか。「RC」を使用すると、 `tso`より小さい最新バージョンのレコードが取得され、ロックは無視されます。「SI」を使用すると、ロックを解決し、解決されたロックがコミットされたか中止されたかに応じてレコードを取得します。
`spark.tispark.coprocessor.chunk_batch_size`	`1024`	コプロセッサからフェッチされた行。
`spark.tispark.isolation_read_engines`	`tikv,tiflash`	TiSpark の読み取り可能なエンジンのカンマ区切りのリスト。リストされていないストレージエンジンは読み取られません。
`spark.tispark.stale_read`	オプション	古い読み取りタイムスタンプ (ミリ秒)。詳細についてはここ参照してください。
`spark.tispark.tikv.tls_enable`	`false`	TiSpark TLS を有効にするかどうか。
`spark.tispark.tikv.trust_cert_collection`		TiKV クライアントの信頼できる証明書。リモート PD の証明書の検証に使用されます。たとえば、 `/home/tispark/config/root.pem`ファイルには X.509 証明書コレクションが含まれている必要があります。
`spark.tispark.tikv.key_cert_chain`		TiKV クライアント用の X.509 証明書チェーンファイル (例: `/home/tispark/config/client.pem` 。
`spark.tispark.tikv.key_file`		TiKV クライアントの PKCS#8 秘密キーファイル (例: `/home/tispark/client_pkcs8.key` )。
`spark.tispark.tikv.jks_enable`	`false`	X.509 証明書の代わりに JAVA キーストアを使用するかどうか。
`spark.tispark.tikv.jks_trust_path`		TiKV クライアントの JKS 形式の証明書。 `keytool`によって生成されます (例: `/home/tispark/config/tikv-truststore` )。
`spark.tispark.tikv.jks_trust_password`		`spark.tispark.tikv.jks_trust_path`のパスワード。
`spark.tispark.tikv.jks_key_path`		TiKV クライアントの JKS 形式キー。 `keytool`によって生成されます (例: `/home/tispark/config/tikv-clientstore` )。
`spark.tispark.tikv.jks_key_password`		`spark.tispark.tikv.jks_key_path`のパスワード。
`spark.tispark.jdbc.tls_enable`	`false`	JDBC コネクタを使用するときに TLS を有効にするかどうか。
`spark.tispark.jdbc.server_cert_store`		JDBC の信頼できる証明書。これは、 `keytool`によって生成されたJavaキーストア (JKS) 形式の証明書です (たとえば、 `/home/tispark/config/jdbc-truststore` 。デフォルト値は「」です。これは、TiSpark が TiDBサーバーを検証しないことを意味します。
`spark.tispark.jdbc.server_cert_password`		`spark.tispark.jdbc.server_cert_store`のパスワード。
`spark.tispark.jdbc.client_cert_store`		JDBC の PKCS#12 証明書。これは、 `keytool` 、たとえば`/home/tispark/config/jdbc-clientstore`によって生成された JKS 形式の証明書です。デフォルトは「」です。これは、TiDBサーバーがTiSpark を検証しないことを意味します。
`spark.tispark.jdbc.client_cert_password`		`spark.tispark.jdbc.client_cert_store`のパスワード。
`spark.tispark.tikv.tls_reload_interval`	`10s`	再ロードする証明書があるかどうかを確認する間隔。デフォルト値は`10s` (10 秒) です。
`spark.tispark.tikv.conn_recycle_time`	`60s`	TiKV との期限切れの接続をクリーニングする間隔。これは、証明書のリロードが有効になっている場合にのみ有効になります。デフォルト値は`60s` (60 秒) です。
`spark.tispark.host_mapping`		パブリック IP アドレスとイントラネット IP アドレス間のマッピングを設定するために使用されるルートマップ。 TiDB クラスターがイントラネット上で実行されている場合、外部の Spark クラスターがアクセスできるように、一連のイントラネット IP アドレスをパブリック IP アドレスにマップできます。形式は`{Intranet IP1}:{Public IP1};{Intranet IP2}:{Public IP2}` 、たとえば`192.168.0.2:8.8.8.8;192.168.0.3:9.9.9.9`です。
`spark.tispark.new_collation_enable`		TiDB で新しい照合順序が有効な場合、この構成は`true`に設定できます。 TiDB で`new collation`が有効になっていない場合は、この構成を`false`に設定できます。この項目が設定されていない場合、TiSpark は TiDB バージョンに基づいて自動的に`new collation`を設定します。構成ルールは次のとおりです。TiDB バージョンが v6.0.0 以上の場合、それは`true`です。それ以外の場合は`false`です。
`spark.tispark.replica_read`	`leader`	読み取るレプリカのタイプ。値のオプションは`leader` 、 `follower` 、および`learner`です。同時に複数のタイプを指定することができ、TiSpark は順序に従ってタイプを選択します。
`spark.tispark.replica_read.label`		ターゲット TiKV ノードのラベル。形式は`label_x=value_x,label_y=value_y`で、項目は論理積で接続されます。

TLS 構成

TiSpark TLS には、TiKV クライアント TLS と JDBC コネクタ TLS の 2 つの部分があります。 TiSpark で TLS を有効にするには、両方を構成する必要があります。 spark.tispark.tikv.xxx 、TiKV クライアントが PD および TiKVサーバーとの TLS 接続を作成するために使用されます。 spark.tispark.jdbc.xxxは、JDBC が TLS 接続で TiDBサーバーに接続するために使用されます。

TiSpark TLS が有効な場合、X.509 証明書をtikv.trust_cert_collection 、 tikv.key_cert_chain 、およびtikv.key_file構成で構成するか、JKS 証明書をtikv.jks_enable 、 tikv.jks_trust_path 、およびtikv.jks_key_pathで構成する必要があります。 jdbc.server_cert_storeとjdbc.client_cert_storeはオプションです。

TiSpark は TLSv1.2 と TLSv1.3 のみをサポートします。

以下は、TiKV クライアントで X.509 証明書を使用して TLS 構成を開く例です。

spark.tispark.tikv.tls_enable                                  true
spark.tispark.tikv.trust_cert_collection                       /home/tispark/root.pem
spark.tispark.tikv.key_cert_chain                              /home/tispark/client.pem
spark.tispark.tikv.key_file                                    /home/tispark/client.key

以下は、TiKV クライアントで JKS 構成を使用して TLS を有効にする例です。

spark.tispark.tikv.tls_enable                                  true
spark.tispark.tikv.jks_enable                                  true
spark.tispark.tikv.jks_key_path                                /home/tispark/config/tikv-truststore
spark.tispark.tikv.jks_key_password                            tikv_trustore_password
spark.tispark.tikv.jks_trust_path                              /home/tispark/config/tikv-clientstore
spark.tispark.tikv.jks_trust_password                          tikv_clientstore_password

JKS 証明書と X.509 証明書の両方が設定されている場合、JKS の優先順位が高くなります。つまり、TLS ビルダーは最初に JKS 証明書を使用します。したがって、共通の PEM 証明書を使用するだけの場合はspark.tispark.tikv.jks_enable=trueを設定しないでください。

以下は、JDBC コネクタで TLS を有効にする例です。

spark.tispark.jdbc.tls_enable                                  true
spark.tispark.jdbc.server_cert_store                           /home/tispark/jdbc-truststore
spark.tispark.jdbc.server_cert_password                        jdbc_truststore_password
spark.tispark.jdbc.client_cert_store                           /home/tispark/jdbc-clientstore
spark.tispark.jdbc.client_cert_password                        jdbc_clientstore_password

TiDB TLS を開く方法の詳細については、 TiDB クライアントとサーバーの間で TLS を有効にするを参照してください。
JAVA キーストアの生成方法の詳細については、 SSLを使用した安全な接続を参照してください。

Log4j 構成

spark-shellまたはspark-sql開始してクエリを実行すると、次の警告が表示される場合があります。

Failed to get database ****, returning NoSuchObjectException
Failed to get database ****, returning NoSuchObjectException

ここで、 ****はデータベース名です。

この警告は無害であり、Spark が独自のカタログ内で****を見つけられないために発生します。これらの警告は無視して構いません。

ミュートするには、次のテキストを${SPARK_HOME}/conf/log4j.propertiesに追加します。

# tispark disable "WARN ObjectStore:568 - Failed to get database"
log4j.logger.org.apache.hadoop.hive.metastore.ObjectStore=ERROR

タイムゾーンの設定

-Duser.timezoneシステムプロパティ (例: -Duser.timezone=GMT-7 ) を使用してタイムゾーンを設定します。これはTimestampタイプに影響します。

spark.sql.session.timeZone使用しないでください。

特徴

TiSpark の主な機能は次のとおりです。

機能のサポート	TiSpark 2.4.x	TiSpark 2.5.x	TiSpark 3.0.x	TiSpark 3.1.x
tdb_catalog を使用しない SQL 選択	✔	✔
tdb_catalog を使用した SQL 選択		✔	✔	✔
データフレームの追加	✔	✔	✔	✔
データフレームの読み取り	✔	✔	✔	✔
SQL はデータベースを表示します	✔	✔	✔	✔
SQL 表示テーブル	✔	✔	✔	✔
SQL認証		✔	✔	✔
SQL削除			✔	✔
SQL挿入				✔
TLS			✔	✔
データフレーム認証				✔

式インデックスのサポート

TiDB v5.0 は式インデックスをサポートします。

TiSpark は現在expression indexを使用したテーブルからのデータの取得をサポートしていますが、 expression index TiSpark のプランナーによって使用されません。

TiFlashを使用する

TiSpark は、設定spark.tispark.isolation_read_enginesを介してTiFlashからデータを読み取ることができます。

パーティション化されたテーブルのサポート

TiDB からパーティション化されたテーブルを読み取る

TiSpark は、TiDB からレンジ分割テーブルとハッシュ分割テーブルを読み取ることができます。

現在、TiSpark は MySQL/TiDB パーティションテーブル構文select col_name from table_name partition(partition_name)をサポートしていません。ただし、 where条件を使用してパーティションをフィルタリングすることはできます。

TiSpark は、テーブルに関連付けられたパーティションタイプとパーティション式に応じて、パーティションプルーニングを適用するかどうかを決定します。

TiSpark は、パーティション式が次のいずれかの場合にのみ、範囲パーティション化にパーティションプルーニングを適用します。

列式
YEAR($argument)引数は列で、その型は日時または日時として解析できる文字列リテラルです。

パーティションプルーニングが適用できない場合、TiSpark の読み取りは、すべてのパーティションに対してテーブルスキャンを実行することと同じになります。

パーティション化されたテーブルへの書き込み

現在、TiSpark は、次の条件下でレンジパーティションテーブルとハッシュパーティションテーブルへのデータの書き込みのみをサポートしています。

パーティション式は列式です。
パーティション式はYEAR($argument)で、引数が列で、その型が日時または日時として解析できる文字列リテラルです。

パーティション化されたテーブルに書き込むには 2 つの方法があります。

データソース API を使用して、置換セマンティクスと追加セマンティクスをサポートするパーティションテーブルに書き込みます。
Spark SQL で delete ステートメントを使用します。

注記：
現在、TiSpark は、utf8mb4_bin照合順序が有効になっているパーティション化されたテーブルへの書き込みのみをサポートしています。

Security

TiSpark v2.5.0 以降のバージョンを使用している場合は、TiDB を使用して TiSpark ユーザーを認証および認可できます。

認証および認可機能はデフォルトでは無効になっています。これを有効にするには、次の構成を Spark 構成ファイルspark-defaults.confに追加します。

// Enable authentication and authorization
spark.sql.auth.enable true

// Configure TiDB information
spark.sql.tidb.addr $your_tidb_server_address
spark.sql.tidb.port $your_tidb_server_port
spark.sql.tidb.user $your_tidb_server_user
spark.sql.tidb.password $your_tidb_server_password

詳細については、 TiDBサーバーを介した認可と認証を参照してください。

その他の機能

統計情報

TiSpark は次の統計情報を使用します。

クエリプランで使用するインデックスを最小の推定コストで決定します。
効率的なブロードキャスト参加を可能にする小規模テーブルブロードキャスト。

TiSpark が統計情報にアクセスできるようにするには、関連するテーブルが分析されていることを確認してください。

テーブルの分析方法の詳細については、統計入門参照してください。

TiSpark 2.0 以降、統計情報はデフォルトで自動的にロードされます。

FAQ

TiSpark FAQを参照してください。