TiSpark を使用してTiFlashレプリカを読み取る
このドキュメントでは、TiSpark を使用してTiFlashレプリカを読み取る方法を紹介します。
現在、TiSpark を使用して、TiDB のエンジン分離と同様の方法でTiFlashレプリカを読み取ることができます。この方法はspark.tispark.isolation_read_enginesパラメータを設定する方法です。パラメータ値のデフォルトはtikv,tiflashです。これは、TiDB が CBO の選択に従ってTiFlashまたは TiKV からデータを読み取ることを意味します。パラメータ値をtiflashに設定すると、TiDB がTiFlashからデータを強制的に読み取ります。
ノート:
このパラメータが
tiflashに設定されている場合、クエリに含まれるすべてのテーブルのTiFlashレプリカのみが読み取られ、これらのテーブルにはTiFlashレプリカが必要です。 TiFlashレプリカがないテーブルの場合、エラーが報告されます。このパラメータをtikvに設定すると、TiKV レプリカのみが読み取られます。
このパラメータは、次のいずれかの方法で構成できます。
spark-defaults.confファイルに次の項目を追加します。spark.tispark.isolation_read_engines tiflashSpark シェルまたは Thriftサーバーを初期化する場合は、初期化コマンドに
--conf spark.tispark.isolation_read_engines=tiflashを追加します。Spark シェルにリアルタイムで
spark.conf.set("spark.tispark.isolation_read_engines", "tiflash")を設定します。サーバーがbeeline経由で接続された後、Thriftサーバーに
set spark.tispark.isolation_read_engines=tiflashを設定します。