重要

このページは英語版のページを機械翻訳しています。原文はこちらからご覧ください。

Google Cloud でセルフホスト型 Kafka プライベートサービス接続を設定する

このドキュメントでは、Google Cloud でセルフホスト型 Kafka 用に Private Service Connect を設定する方法と、それをTiDB Cloudで動作させる方法について説明します。

このメカニズムは次のように機能します。

TiDB Cloud VPC はプライベートエンドポイントを介して Kafka VPC に接続します。
Kafka クライアントはすべての Kafka ブローカーと直接通信する必要があります。
各 Kafka ブローカーは、 TiDB Cloud VPC 内の一意のポートにマッピングされます。
マッピングを実現するには、Kafka ブートストラップメカニズムと Google Cloud リソースを活用します。

Google Cloud でセルフホスト型 Kafka に Private Service Connect を設定するには、次の 2 つの方法があります。

Private Service Connect (PSC) ポートマッピングメカニズムを使用します。この方法では、静的ポートブローカーマッピング構成が必要です。EXTERNAL リスナーとアドバタイズされたリスナーのグループを追加するには、既存の Kafka クラスターを再構成する必要がありますPSC ポートマッピングによるセルフホスト型 Kafka Private Service Connect サービスの設定参照してください。
Kafka プロキシ使用します。この方法では、Kafka クライアントと Kafka ブローカー間のプロキシとして追加の実行プロセスが導入されます。プロキシはポートとブローカーのマッピングを動的に構成し、リクエストを転送します。既存の Kafka クラスターを再構成する必要はありませんKafka-proxy によるセルフホスト型 Kafka プライベートサービス接続の設定参照してください。

このドキュメントでは、Google Cloud の 3 つのアベイラビリティゾーン (AZ) にデプロイされた Kafka Private Service Connect サービスに接続する例を示します。同様のポートマッピング原則に基づいて他の構成も可能ですが、このドキュメントでは Kafka Private Service Connect サービスの基本的なセットアッププロセスについて説明します。本番環境では、運用の保守性と監視性が強化された、より回復力の高い Kafka Private Service Connect サービスが推奨されます。

前提条件

自分の Google Cloud アカウントで Kafka Private Service Connect を設定するには、次の権限があることを確認してください。
- VMノードを管理する
- VPC の管理
- サブネットを管理する
- ロードバランサーを管理する
- プライベートサービス接続の管理
- VMノードに接続してKafkaノードを構成する
持っていない場合はTiDB Cloud専用クラスターを作成する。
TiDB Cloud Dedicated クラスターから Kafka デプロイメント情報を取得します。
1. TiDB Cloudコンソールで、TiDB クラスターのクラスター概要ページに移動し、左側のナビゲーションペインで[Changefeed]をクリックします。
2. 概要ページで、TiDB クラスターのリージョンを見つけます。Kafka クラスターが同じリージョンにデプロイされることを確認します。
3. 「Changefeed の作成」をクリックします。
  1. ターゲットタイプで、 Kafka を選択します。
  2. 接続方法で、プライベートサービス接続を選択します。
4. 続行する前に、リマインダーに Google Cloud プロジェクトを書き留めておきます。これを使用して、 TiDB Cloudからのエンドポイント作成リクエストの自動承認を承認します。
5. TiDBクラスタのゾーンを書き留めます。これらのゾーンに TiDB クラスターをデプロイします。ゾーン間のトラフィックを減らすために、これらのゾーンに Kafka をデプロイすることをお勧めします。
6. Kafka プライベートサービス接続サービスに固有のKafka アドバタイズリスナーパターンを選択します。
  1. 一意のランダム文字列を入力します。数字または小文字のみを含めることができます。これは後でKafka アドバタイズリスナーパターンを生成するために使用します。
  2. 「使用状況を確認して生成」をクリックすると、ランダム文字列が一意であるかどうかが確認され、Kafka ブローカーの外部アドバタイズリスナーを組み立てるために使用されるKafka アドバタイズリスナーパターンが生成されるか、Kafka プロキシが構成されます。

すべてのデプロイメント情報を書き留めます。後で Kafka Private Service Connect サービスを構成するときにこれを使用する必要があります。

次の表は、デプロイメント情報の例を示しています。

情報	価値
リージョン	オレゴン ( `us-west1` )
TiDB Cloudの Google Cloud プロジェクト	`tidbcloud-prod-000`
ゾーン	`us-west1-a` `us-west1-b` `us-west1-c`
Kafka アドバタイズドリスナーパターン	一意のランダム文字列: `abc` 生成されたパターン: <broker_id>.abc.us-west1.gcp.3199745.tidbcloud.com:<port>

PSC ポートマッピングによるセルフホスト型 Kafka Private Service Connect サービスの設定

PSC ポートマッピングメカニズムを使用して、各 Kafka ブローカーを一意のポートでTiDB Cloud VPC に公開します。次の図は、その仕組みを示しています。

Connect to Google Cloud self-hosted Kafka Private Service Connect by port mapping

ステップ1. Kafkaクラスターをセットアップする

新しいクラスターをデプロイする必要がある場合は、新しい Kafka クラスターをデプロイの手順に従ってください。

既存のクラスターを公開する必要がある場合は、実行中の Kafka クラスターを再構成するの手順に従ってください。

新しい Kafka クラスターをデプロイ

1. Kafka VPCをセットアップする

Kafka クラスターを簡単に構成できるように、Kafka VPC 用に 2 つのサブネットを作成する必要があります。1 つは Kafka ブローカー用、もう 1 つは要塞ノード用です。

Google Cloud コンソールに移動し、 VPC ネットワークページに移動して、次の属性を持つ Kafka VPC を作成します。

名前: kafka-vpc
サブネット
- 名前: bastion-subnet ;リージョン: us-west1 ; IPv4 範囲: 10.0.0.0/18
- 名前: brokers-subnet ;リージョン: us-west1 ; IPv4 範囲: 10.64.0.0/18
ファイアウォールルール
- kafka-vpc-allow-custom
- kafka-vpc-allow-ssh

2. VMのプロビジョニング

VM をプロビジョニングするには、 VMインスタンスページに移動します。

バスティオンノード
- 名前: bastion-node
- リージョン: us-west1
- ゾーン: Any
- マシンタイプ: e2-medium
- 画像: Debian GNU/Linux 12
- ネットワーク: kafka-vpc
- サブネットワーク: bastion-subnet
- 外部 IPv4 アドレス: Ephemeral
ブローカーノード 1
- 名前: broker-node1
- リージョン: us-west1
- ゾーン: us-west1-a
- マシンタイプ: e2-medium
- 画像: Debian GNU/Linux 12
- ネットワーク: kafka-vpc
- サブネットワーク: brokers-subnet
- 外部 IPv4 アドレス: None
ブローカーノード2
- 名前: broker-node2
- リージョン: us-west1
- ゾーン: us-west1-b
- マシンタイプ: e2-medium
- 画像: Debian GNU/Linux 12
- ネットワーク: kafka-vpc
- サブネットワーク: brokers-subnet
- 外部 IPv4 アドレス: None
ブローカーノード3
- 名前: broker-node3
- リージョン: us-west1
- ゾーン: us-west1-c
- マシンタイプ: e2-medium
- 画像: Debian GNU/Linux 12
- ネットワーク: kafka-vpc
- サブネットワーク: brokers-subnet
- 外部 IPv4 アドレス: None

3. Kafkaランタイムバイナリを準備する

要塞ノードの詳細ページに移動します。SSHをクリックして要塞ノードにログインします。バイナリをダウンロードします。

# Download Kafka and OpenJDK, and then extract the files. You can choose the binary version based on your preference.
wget https://archive.apache.org/dist/kafka/3.7.1/kafka_2.13-3.7.1.tgz
tar -zxf kafka_2.13-3.7.1.tgz
wget https://download.java.net/java/GA/jdk22.0.2/c9ecb94cd31b495da20a27d4581645e8/9/GPL/openjdk-22.0.2_linux-x64_bin.tar.gz
tar -zxf openjdk-22.0.2_linux-x64_bin.tar.gz

バイナリを各ブローカーノードにコピーします。

# Run this command to authorize gcloud to access the Cloud Platform with Google user credentials
# Follow the instruction in output to finish the login
gcloud auth login

# Copy binaries to broker nodes
gcloud compute scp kafka_2.13-3.7.1.tgz openjdk-22.0.2_linux-x64_bin.tar.gz broker-node1:~ --zone=us-west1-a
gcloud compute ssh broker-node1 --zone=us-west1-a --command="tar -zxf kafka_2.13-3.7.1.tgz && tar -zxf openjdk-22.0.2_linux-x64_bin.tar.gz"
gcloud compute scp kafka_2.13-3.7.1.tgz openjdk-22.0.2_linux-x64_bin.tar.gz broker-node2:~ --zone=us-west1-b
gcloud compute ssh broker-node2 --zone=us-west1-b --command="tar -zxf kafka_2.13-3.7.1.tgz && tar -zxf openjdk-22.0.2_linux-x64_bin.tar.gz"
gcloud compute scp kafka_2.13-3.7.1.tgz openjdk-22.0.2_linux-x64_bin.tar.gz broker-node3:~ --zone=us-west1-c
gcloud compute ssh broker-node3 --zone=us-west1-c --command="tar -zxf kafka_2.13-3.7.1.tgz && tar -zxf openjdk-22.0.2_linux-x64_bin.tar.gz"

4. Kafkaブローカーを構成する

3 つのノードを持つ KRaft Kafka クラスターをセットアップします。各ノードはブローカーとコントローラーの役割として機能します。各ブローカーについて:
1. listeners場合、3 つのブローカーはすべて同じであり、ブローカーとコントローラーのロールとして機能します。
  1. すべてのコントローラーロールノードに対して同じ CONTROLLER リスナーを構成します。ブローカーロールノードのみを追加する場合は、 server.propertiesの CONTROLLER リスナーは必要ありません。
  2. 2 つのブローカーリスナーを構成します。内部アクセスの場合は INTERNAL、 TiDB Cloudからの外部アクセスの場合は EXTERNAL です。
2. advertised.listenersについては、次の操作を行います。
  1. ブローカーノードの内部 IP アドレスを使用して、各ブローカーの内部アドバタイズリスナーを構成します。これにより、内部 Kafka クライアントはアドバタイズアドレスを介してブローカーに接続できるようになります。
  2. TiDB Cloud がさまざまなブローカーを区別できるように、すべてのブローカーノードに対してTiDB Cloudから取得したKafka アドバタイズリスナーパターンに基づいて EXTERNAL アドバタイズリスナーを構成します。さまざまな EXTERNAL アドバタイズリスナーにより、 TiDB Cloud側の Kafka クライアントは適切なブローカーにリクエストをルーティングできます。
    - <port> 、ブローカーを Kafka Private Service Connect アクセスポイントと区別します。すべてのブローカーの EXTERNAL アドバタイズリスナーのポート範囲を計画します。これらのポートは、ブローカーが実際にリッスンするポートである必要はありません。これらは、リクエストを別のブローカーに転送する Private Service Connect のロードバランサーがリッスンするポートです。
    - トラブルシューティングを容易にするために、ブローカーごとに異なるブローカー ID を構成することをお勧めします。
3. 計画値:
  - コントローラーポート: 29092
  - 内部ポート: 9092
  - 外部: 39092
  - 外部アドバタイズされたリスナーポート範囲: 9093~9095

SSH を使用してすべてのブローカーノードにログインします。各ブローカーノードごとに次の内容を含む構成ファイル~/config/server.propertiesを作成します。

# broker-node1 ~/config/server.properties
# 1. Replace {broker-node1-ip}, {broker-node2-ip}, {broker-node3-ip} with the actual IP addresses.
# 2. Configure EXTERNAL in "advertised.listeners" based on the "Kafka Advertised Listener Pattern" in the "Prerequisites" section.
# 2.1 The pattern is "<broker_id>.abc.us-west1.gcp.3199745.tidbcloud.com:<port>".
# 2.2 So the EXTERNAL can be "b1.abc.us-west1.gcp.3199745.tidbcloud.com:9093". Replace <broker_id> with "b" prefix plus "node.id" properties, and replace <port> with a unique port (9093) in the port range of the EXTERNAL advertised listener.
process.roles=broker,controller
node.id=1
controller.quorum.voters=1@{broker-node1-ip}:29092,2@{broker-node2-ip}:29092,3@{broker-node3-ip}:29092
listeners=INTERNAL://0.0.0.0:9092,CONTROLLER://0.0.0.0:29092,EXTERNAL://0.0.0.0:39092
inter.broker.listener.name=INTERNAL
advertised.listeners=INTERNAL://{broker-node1-ip}:9092,EXTERNAL://b1.abc.us-west1.gcp.3199745.tidbcloud.com:9093
controller.listener.names=CONTROLLER
listener.security.protocol.map=INTERNAL:PLAINTEXT,CONTROLLER:PLAINTEXT,EXTERNAL:PLAINTEXT,SSL:SSL,SASL_PLAINTEXT:SASL_PLAINTEXT,SASL_SSL:SASL_SSL
log.dirs=./data

# broker-node2 ~/config/server.properties
# 1. Replace {broker-node1-ip}, {broker-node2-ip}, {broker-node3-ip} with the actual IP addresses.
# 2. Configure EXTERNAL in "advertised.listeners" based on the "Kafka Advertised Listener Pattern" in the "Prerequisites" section.
# 2.1 The pattern is "<broker_id>.abc.us-west1.gcp.3199745.tidbcloud.com:<port>".
# 2.2 So the EXTERNAL can be "b2.abc.us-west1.gcp.3199745.tidbcloud.com:9094". Replace <broker_id> with "b" prefix plus "node.id" properties, and replace <port> with a unique port (9094) in the port range of the EXTERNAL advertised listener.
process.roles=broker,controller
node.id=2
controller.quorum.voters=1@{broker-node1-ip}:29092,2@{broker-node2-ip}:29092,3@{broker-node3-ip}:29092
listeners=INTERNAL://0.0.0.0:9092,CONTROLLER://0.0.0.0:29092,EXTERNAL://0.0.0.0:39092
inter.broker.listener.name=INTERNAL
advertised.listeners=INTERNAL://{broker-node2-ip}:9092,EXTERNAL://b2.abc.us-west1.gcp.3199745.tidbcloud.com:9094
controller.listener.names=CONTROLLER
listener.security.protocol.map=INTERNAL:PLAINTEXT,CONTROLLER:PLAINTEXT,EXTERNAL:PLAINTEXT,SSL:SSL,SASL_PLAINTEXT:SASL_PLAINTEXT,SASL_SSL:SASL_SSL
log.dirs=./data

# broker-node3 ~/config/server.properties
# 1. Replace {broker-node1-ip}, {broker-node2-ip}, {broker-node3-ip} with the actual IP addresses.
# 2. Configure EXTERNAL in "advertised.listeners" based on the "Kafka Advertised Listener Pattern" in the "Prerequisites" section.
# 2.1 The pattern is "<broker_id>.abc.us-west1.gcp.3199745.tidbcloud.com:<port>".
# 2.2 So the EXTERNAL can be "b3.abc.us-west1.gcp.3199745.tidbcloud.com:9095". Replace <broker_id> with "b" prefix plus "node.id" properties, and replace <port> with a unique port (9095) in the port range of the EXTERNAL advertised listener.
process.roles=broker,controller
node.id=3
controller.quorum.voters=1@{broker-node1-ip}:29092,2@{broker-node2-ip}:29092,3@{broker-node3-ip}:29092
listeners=INTERNAL://0.0.0.0:9092,CONTROLLER://0.0.0.0:29092,EXTERNAL://0.0.0.0:39092
inter.broker.listener.name=INTERNAL
advertised.listeners=INTERNAL://{broker-node3-ip}:9092,EXTERNAL://b3.abc.us-west1.gcp.3199745.tidbcloud.com:9095
controller.listener.names=CONTROLLER
listener.security.protocol.map=INTERNAL:PLAINTEXT,CONTROLLER:PLAINTEXT,EXTERNAL:PLAINTEXT,SSL:SSL,SASL_PLAINTEXT:SASL_PLAINTEXT,SASL_SSL:SASL_SSL
log.dirs=./data

スクリプトを作成し、それを実行して各ブローカーノードで Kafka ブローカーを起動します。

#!/bin/bash

# Get the directory of the current script
SCRIPT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")" && pwd)"
# Set JAVA_HOME to the Java installation within the script directory
export JAVA_HOME="$SCRIPT_DIR/jdk-22.0.2"
# Define the vars
KAFKA_DIR="$SCRIPT_DIR/kafka_2.13-3.7.1/bin"
KAFKA_STORAGE_CMD=$KAFKA_DIR/kafka-storage.sh
KAFKA_START_CMD=$KAFKA_DIR/kafka-server-start.sh
KAFKA_DATA_DIR=$SCRIPT_DIR/data
KAFKA_LOG_DIR=$SCRIPT_DIR/log
KAFKA_CONFIG_DIR=$SCRIPT_DIR/config

# Cleanup step, which makes it easy for multiple experiments
# Find all Kafka process IDs
KAFKA_PIDS=$(ps aux | grep 'kafka.Kafka' | grep -v grep | awk '{print $2}')
if [ -z "$KAFKA_PIDS" ]; then
echo "No Kafka processes are running."
else
# Kill each Kafka process
echo "Killing Kafka processes with PIDs: $KAFKA_PIDS"
for PID in $KAFKA_PIDS; do
    kill -9 $PID
    echo "Killed Kafka process with PID: $PID"
done
echo "All Kafka processes have been killed."
fi

rm -rf $KAFKA_DATA_DIR
mkdir -p $KAFKA_DATA_DIR
rm -rf $KAFKA_LOG_DIR
mkdir -p $KAFKA_LOG_DIR

# Magic id: BRl69zcmTFmiPaoaANybiw. You can use your own magic ID.
$KAFKA_STORAGE_CMD format -t "BRl69zcmTFmiPaoaANybiw" -c "$KAFKA_CONFIG_DIR/server.properties" > $KAFKA_LOG_DIR/server_format.log   
LOG_DIR=$KAFKA_LOG_DIR nohup $KAFKA_START_CMD "$KAFKA_CONFIG_DIR/server.properties" &

5. 要塞ノードで Kafka クラスターをテストする

Kafka ブートストラップをテストします。

export JAVA_HOME=~/jdk-22.0.2

# Bootstrap from INTERNAL listener
./kafka_2.13-3.7.1/bin/kafka-broker-api-versions.sh --bootstrap-server {one_of_broker_ip}:9092 | grep 9092
# Expected output (the actual order might be different)
{broker-node1-ip}:9092 (id: 1 rack: null) -> (
{broker-node2-ip}:9092 (id: 2 rack: null) -> (
{broker-node3-ip}:9092 (id: 3 rack: null) -> (

# Bootstrap from EXTERNAL listener
./kafka_2.13-3.7.1/bin/kafka-broker-api-versions.sh --bootstrap-server {one_of_broker_ip}:39092
# Expected output for the last 3 lines (the actual order might be different)
# The difference in the output from "bootstrap from INTERNAL listener" is that exceptions or errors might occur because advertised listeners cannot be resolved in Kafka VPC.
# We will make them resolvable in TiDB Cloud side and make it route to the right broker when you create a changefeed connect to this Kafka cluster by Private Service Connect. 
b1.abc.us-west1.gcp.3199745.tidbcloud.com:9093 (id: 1 rack: null) -> ERROR: org.apache.kafka.common.errors.DisconnectException
b2.abc.us-west1.gcp.3199745.tidbcloud.com:9094 (id: 2 rack: null) -> ERROR: org.apache.kafka.common.errors.DisconnectException
b3.abc.us-west1.gcp.3199745.tidbcloud.com:9095 (id: 3 rack: null) -> ERROR: org.apache.kafka.common.errors.DisconnectException

要塞ノードにプロデューサースクリプトproduce.shを作成します。

#!/bin/bash
BROKER_LIST=$1 # "{broker_address1},{broker_address2}..."

# Get the directory of the current script
SCRIPT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")" && pwd)"
# Set JAVA_HOME to the Java installation within the script directory
export JAVA_HOME="$SCRIPT_DIR/jdk-22.0.2"
# Define the Kafka directory
KAFKA_DIR="$SCRIPT_DIR/kafka_2.13-3.7.1/bin"
TOPIC="test-topic"

# Create a topic if it does not exist
create_topic() {
echo "Creating topic if it does not exist..."
$KAFKA_DIR/kafka-topics.sh --create --topic $TOPIC --bootstrap-server $BROKER_LIST --if-not-exists --partitions 3 --replication-factor 3
}

# Produce messages to the topic
produce_messages() {
echo "Producing messages to the topic..."
for ((chrono=1; chrono <= 10; chrono++)); do
    message="Test message "$chrono
    echo "Create "$message
    echo $message | $KAFKA_DIR/kafka-console-producer.sh --broker-list $BROKER_LIST --topic $TOPIC
done
}
create_topic
produce_messages

要塞ノードにコンシューマースクリプトconsume.shを作成します。

#!/bin/bash

BROKER_LIST=$1 # "{broker_address1},{broker_address2}..."

# Get the directory of the current script
SCRIPT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")" && pwd)"
# Set JAVA_HOME to the Java installation within the script directory
export JAVA_HOME="$SCRIPT_DIR/jdk-22.0.2"
# Define the Kafka directory
KAFKA_DIR="$SCRIPT_DIR/kafka_2.13-3.7.1/bin"
TOPIC="test-topic"
CONSUMER_GROUP="test-group"
# Consume messages from the topic
consume_messages() {
echo "Consuming messages from the topic..."
$KAFKA_DIR/kafka-console-consumer.sh --bootstrap-server $BROKER_LIST --topic $TOPIC --from-beginning --timeout-ms 5000 --consumer-property group.id=$CONSUMER_GROUP
}
consume_messages

produce.shとconsume.shを実行して、Kafka クラスターが実行中であることを確認します。これらのスクリプトは、後のネットワーク接続テストでも再利用されます。スクリプトは--partitions 3 --replication-factor 3でトピックを作成します。3 つのブローカーすべてにデータが含まれていることを確認します。スクリプトが 3 つのブローカーすべてに接続して、ネットワーク接続がテストされることを保証します。

# Test write message. 
./produce.sh {one_of_broker_ip}:9092

# Expected output
Creating topic if it does not exist...

Producing messages to the topic...
Create Test message 1
>>Create Test message 2
>>Create Test message 3
>>Create Test message 4
>>Create Test message 5
>>Create Test message 6
>>Create Test message 7
>>Create Test message 8
>>Create Test message 9
>>Create Test message 10

# Test read message
./consume.sh {one_of_broker_ip}:9092

# Expected example output (the actual message order might be different)
Consuming messages from the topic...
Test message 3
Test message 4
Test message 5
Test message 9
Test message 10
Test message 6
Test message 8
Test message 1
Test message 2
Test message 7
[2024-11-01 08:54:27,547] ERROR Error processing message, terminating consumer process:  (kafka.tools.ConsoleConsumer$)
org.apache.kafka.common.errors.TimeoutException
Processed a total of 10 messages

実行中の Kafka クラスターを再構成する

Kafka クラスターが TiDB クラスターと同じリージョンにデプロイされていることを確認します。ゾーン間のトラフィックを削減するために、ゾーンも同じリージョンに配置することをお勧めします。

1. ブローカーの外部リスナーを構成する

次の構成は、Kafka KRaft クラスターに適用されます。ZK モードの構成も同様です。

構成の変更を計画します。
1. TiDB Cloudからの外部アクセス用に、ブローカーごとに EXTERNALリスナーを構成します。 EXTERNAL ポートとして一意のポート (例: 39092 ) を選択します。
2. TiDB Cloud がさまざまなブローカーを区別できるように、すべてのブローカーノードに対してTiDB Cloudから取得したKafka アドバタイズリスナーパターンに基づいて EXTERNALアドバタイズリスナーを構成します。さまざまな EXTERNAL アドバタイズリスナーにより、 TiDB Cloud側の Kafka クライアントは適切なブローカーにリクエストをルーティングできます。
  - <port> 、ブローカーを Kafka Private Service Connect アクセスポイントと区別します。すべてのブローカーの EXTERNAL アドバタイズリスナーのポート範囲を計画します (例: range from 9093 )。これらのポートは、ブローカーがリッスンする実際のポートである必要はありません。これらは、リクエストを別のブローカーに転送する Private Service Connect のロードバランサーがリッスンするポートです。
  - トラブルシューティングを容易にするために、ブローカーごとに異なるブローカー ID を構成することをお勧めします。

SSH を使用して各ブローカーノードにログインします。各ブローカーの構成ファイルを次の内容に変更します。

# Add EXTERNAL listener
listeners=INTERNAL:...,EXTERNAL://0.0.0.0:39092

# Add EXTERNAL advertised listeners based on the "Kafka Advertised Listener Pattern" in the "Prerequisites" section
# 1. The pattern is "<broker_id>.abc.us-west1.gcp.3199745.tidbcloud.com:<port>".
# 2. So the EXTERNAL can be "bx.abc.us-west1.gcp.3199745.tidbcloud.com:xxxx". Replace <broker_id> with "b" prefix plus "node.id" properties, and replace <port> with a unique port in the port range of the EXTERNAL advertised listener.
# For example
advertised.listeners=...,EXTERNAL://b1.abc.us-west1.gcp.3199745.tidbcloud.com:9093

# Configure EXTERNAL map
listener.security.protocol.map=...,EXTERNAL:PLAINTEXT

すべてのブローカーを再構成したら、Kafka ブローカーを 1 つずつ再起動します。

2. 内部ネットワークで外部リスナー設定をテストする

Kafka と OpenJDK を Kafka クライアントノードにダウンロードできます。

# Download Kafka and OpenJDK, and then extract the files. You can choose the binary version based on your preference.
wget https://archive.apache.org/dist/kafka/3.7.1/kafka_2.13-3.7.1.tgz
tar -zxf kafka_2.13-3.7.1.tgz
wget https://download.java.net/java/GA/jdk22.0.2/c9ecb94cd31b495da20a27d4581645e8/9/GPL/openjdk-22.0.2_linux-x64_bin.tar.gz
tar -zxf openjdk-22.0.2_linux-x64_bin.tar.gz

次のスクリプトを実行して、ブートストラップが期待どおりに動作するかどうかをテストします。

export JAVA_HOME=~/jdk-22.0.2

# Bootstrap from the EXTERNAL listener
./kafka_2.13-3.7.1/bin/kafka-broker-api-versions.sh --bootstrap-server {one_of_broker_ip}:39092

# Expected output for the last 3 lines (the actual order might be different)
# There will be some exceptions or errors because advertised listeners cannot be resolved in your Kafka network. 
# We will make them resolvable in TiDB Cloud side and make it route to the right broker when you create a changefeed connect to this Kafka cluster by Private Service Connect. 
b1.abc.us-west1.gcp.3199745.tidbcloud.com:9093 (id: 1 rack: null) -> ERROR: org.apache.kafka.common.errors.DisconnectException
b2.abc.us-west1.gcp.3199745.tidbcloud.com:9094 (id: 2 rack: null) -> ERROR: org.apache.kafka.common.errors.DisconnectException
b3.abc.us-west1.gcp.3199745.tidbcloud.com:9095 (id: 3 rack: null) -> ERROR: org.apache.kafka.common.errors.DisconnectException

ステップ2. Kafkaクラスターをプライベートサービス接続として公開する

ネットワークエンドポイントグループページに移動します。次のようにネットワークエンドポイントグループを作成します。
- 名前: kafka-neg
- ネットワークエンドポイントグループタイプ: Port Mapping NEG(Regional)
  - リージョン: us-west1
  - ネットワーク: kafka-vpc
  - サブネット: brokers-subnet
ネットワークエンドポイントグループの詳細ページに移動し、ネットワークエンドポイントを追加して、ブローカーノードへのポートマッピングを構成します。
1. ネットワークエンドポイント1
  - インスタンス: broker-node1
  - VM ポート: 39092
  - クライアントポート: 9093
2. ネットワークエンドポイント2
  - インスタンス: broker-node2
  - VM ポート: 39092
  - クライアントポート: 9094
3. ネットワークエンドポイント3
  - インスタンス: broker-node3
  - VM ポート: 39092
  - クライアントポート: 9095
負荷分散ページに移動します。次のようにロードバランサーを作成します。
- ロードバランサーの種類: Network Load Balancer
- プロキシまたはパススルー: Passthrough
- 対外的または内部的: Internal
- ロードバランサー名: kafka-lb
- リージョン: us-west1
- ネットワーク: kafka-vpc
- バックエンド構成
  - バックエンドタイプ: Port mapping network endpoint group
  - プロトコル: TCP
  - ポートマッピングネットワークエンドポイントグループ: kafka-neg
- フロントエンド構成
  - サブネットワーク: brokers-subnet
  - ポート: All
プライベートサービス接続>公開サービスに進みます。
- ロードバランサータイプ: Internal passthrough Network Load Balancer
- 内部ロードバランサ: kafka-lb
- サービス名: kafka-psc
- サブネット: RESERVE NEW SUBNET
  - 名前: psc-subnet
  - VPC ネットワーク: kafka-vpc
  - リージョン: us-west1
  - IPv4範囲: 10.128.0.0/18
- 承認されたプロジェクト: 前提条件で取得したTiDB Cloudの Google Cloud プロジェクト (例: tidbcloud-prod-000 )。
kafka-pscの詳細ページに移動します。サービスアタッチメント(例: projects/tidbcloud-dp-stg-000/regions/us-west1/serviceAttachments/kafka-psc ) を書き留めます。TiDB TiDB Cloudでこれを使用して、この PSC に接続します。
VPC ネットワークkafka-vpcの詳細ページに移動し、すべてのブローカーへの PSC トラフィックを許可するファイアウォールルールを追加します。
- 名前: allow-psc-traffic
- 交通方向: Ingress
- 試合のアクション: Allow
- ターゲット: All instances in the network
- ソースフィルター: IPv4 ranges
- ソース IPv4 範囲: 10.128.0.0/18 -subnet の範囲。
- プロトコルとポート: すべて許可

ステップ3. TiDB Cloudから接続する

TiDB Cloudコンソールに戻り、クラスターの変更フィードを作成し、 Private Service Connectで Kafka クラスターに接続します。詳細については、 Apache Kafka にシンクする参照してください。
「ChangeFeed ターゲットの構成」>「接続方法」>「プライベートサービス接続」に進むときは、次のフィールドに対応する値を入力し、必要に応じて他のフィールドに入力します。
- Kafka アドバタイズリスナーパターン: abc 。これは、前提条件でKafka アドバタイズリスナーパターンを生成するために使用する一意のランダム文字列と同じです。
- サービスアタッチメント: PSC の Kafka サービスアタッチメント (例: projects/tidbcloud-dp-stg-000/regions/us-west1/serviceAttachments/kafka-psc 。
- ブートストラップポート: 9092,9093,9094
Apache Kafka にシンクするの手順に進みます。

Kafka-proxy によるセルフホスト型 Kafka プライベートサービス接続の設定

Kafka プロキシの動的ポートマッピングメカニズムを使用して、各 Kafka ブローカーを一意のポートでTiDB Cloud VPC に公開します。次の図は、その仕組みを示しています。

Connect to Google Cloud self-hosted Kafka Private Service Connect by Kafka proxy

ステップ1. Kafka-proxyを設定する

TiDB クラスターと同じリージョンで Kafka クラスターがすでに実行されていると仮定します。VPC ネットワークから Kafka クラスターに接続できます。Kafka クラスターは、セルフホストすることも、Confluent などのサードパーティプロバイダーによって提供されることもできます。

インスタンスグループページに移動し、Kafka-proxy のインスタンスグループを作成します。
- 名前: kafka-proxy-ig
- インスタンステンプレート:
  - 名前: kafka-proxy-tpl
  - 場所: Regional
  - リージョン: us-west1
  - マシンタイプ: e2-mediumワークロードに応じて独自のマシンタイプを選択できます。
  - ネットワーク: Kafka クラスターに接続できる VPC ネットワーク。
  - サブネットワーク: Kafka クラスターに接続できるサブネット。
  - 外部 IPv4 アドレス: Ephemeralインターネットアクセスを有効にすると、Kafka-proxy を簡単に構成できるようになります。本番環境では[なし]を選択し、任意の方法でノードにログインできます。
- 場所: Single zone
- リージョン: us-west1
- ゾーン: ブローカーのゾーンの 1 つを選択します。
- 自動スケーリングモード: Off
- インスタンスの最小数: 1
- インスタンスの最大数: 1プロキシはクラスターモードをサポートしていないため、デプロイできるインスタンスは 1 つだけです。各 Kafka プロキシは、ローカルポートをブローカーのポートにランダムにマッピングするため、プロキシ間でマッピングが異なります。ロードバランサーの背後に複数の Kafka プロキシをデプロイすると、問題が発生する可能性があります。Kafka クライアントが 1 つのプロキシに接続し、別のプロキシを介してブローカーにアクセスすると、リクエストが間違ったブローカーにルーティングされる可能性があります。

kafka-proxy-ig のノードの詳細ページに移動します。SSHをクリックしてノードにログインします。バイナリをダウンロードします。

# You can choose another version 
wget https://github.com/grepplabs/kafka-proxy/releases/download/v0.3.11/kafka-proxy-v0.3.11-linux-amd64.tar.gz
tar -zxf kafka-proxy-v0.3.11-linux-amd64.tar.gz

Kafka-proxy を実行し、Kafka ブローカーに接続します。

# There are three kinds of parameters that need to feed to the Kafka-proxy
# 1. --bootstrap-server-mapping defines the bootstrap mapping. Suggest that you configure three mappings, one for each zone for resilience.
#   a) Kafka broker address; 
#   b) Local address for the broker in Kafka-proxy; 
#   c) Advertised listener for the broker if Kafka clients bootstrap from Kafka-proxy
# 2. --dynamic-sequential-min-port defines the start port of the random mapping for other brokers
# 3. --dynamic-advertised-listener defines advertised listener address for other brokers based on the pattern obtained from the "Prerequisites" section
#   a) The pattern: <broker_id>.abc.us-west1.gcp.3199745.tidbcloud.com:<port>
#   b) Make sure to replace <broker_id> with a fixed lowercase string, for example, "brokers". You can use your own string. This step will help TiDB Cloud route requests properly.
#   c) Remove ":<port>"
#   d) The advertised listener address would be: brokers.abc.us-west1.gcp.3199745.tidbcloud.com
./kafka-proxy server \
        --bootstrap-server-mapping "{address_of_broker1},0.0.0.0:9092,b1.abc.us-west1.gcp.3199745.tidbcloud.com:9092" \
        --bootstrap-server-mapping "{address_of_broker2},0.0.0.0:9093,b2.abc.us-west1.gcp.3199745.tidbcloud.com:9093" \
        --bootstrap-server-mapping "{address_of_broker3},0.0.0.0:9094,b3.abc.us-west1.gcp.3199745.tidbcloud.com:9094" \
        --dynamic-sequential-min-port=9095 \
        --dynamic-advertised-listener=brokers.abc.us-west1.gcp.3199745.tidbcloud.com > ./kafka_proxy.log 2>&1 &

Kafka-proxy ノードでブートストラップをテストします。

# Download Kafka and OpenJDK, and then extract the files. You can choose the binary version based on your preference.
wget https://archive.apache.org/dist/kafka/3.7.1/kafka_2.13-3.7.1.tgz
tar -zxf kafka_2.13-3.7.1.tgz
wget https://download.java.net/java/GA/jdk22.0.2/c9ecb94cd31b495da20a27d4581645e8/9/GPL/openjdk-22.0.2_linux-x64_bin.tar.gz
tar -zxf openjdk-22.0.2_linux-x64_bin.tar.gz

export JAVA_HOME=~/jdk-22.0.2

./kafka_2.13-3.7.1/bin/kafka-broker-api-versions.sh --bootstrap-server 0.0.0.0:9092
# Expected output of the last few lines (the actual order might be different)
# There might be exceptions or errors because advertised listeners cannot be resolved in your network.
# We will make them resolvable in TiDB Cloud side and make it route to the right broker when you create a changefeed connect to this Kafka cluster by Private Service Connect. 
b1.abc.us-west1.gcp.3199745.tidbcloud.com:9092 (id: 1 rack: null) -> ERROR: org.apache.kafka.common.errors.DisconnectException
b2.abc.us-west1.gcp.3199745.tidbcloud.com:9093 (id: 2 rack: null) -> ERROR: org.apache.kafka.common.errors.DisconnectException
b3.abc.us-west1.gcp.3199745.tidbcloud.com:9094 (id: 3 rack: null) -> ERROR: org.apache.kafka.common.errors.DisconnectException
brokers.abc.us-west1.gcp.3199745.tidbcloud.com:9095 (id: 4 rack: null) -> ERROR: org.apache.kafka.common.errors.DisconnectException
brokers.abc.us-west1.gcp.3199745.tidbcloud.com:9096 (id: 5 rack: null) -> ERROR: org.apache.kafka.common.errors.DisconnectException
...

ステップ 2. Kafka-proxy をプライベートサービス接続サービスとして公開する

負荷分散ページに移動し、ロードバランサーを作成します。
- ロードバランサーの種類: Network Load Balancer
- プロキシまたはパススルー: Passthrough
- 対外的または内部的: Internal
- ロードバランサー名: kafka-proxy-lb
- リージョン: us-west1
- ネットワーク: あなたのネットワーク
- バックエンド構成
  - バックエンドタイプ: Instance group
  - プロトコル: TCP
  - インスタンスグループ: kafka-proxy-ig
- フロントエンド構成
  - サブネットワーク: サブネット
  - ポート: All
  - 健康チェック:
    - 名前: kafka-proxy-hc
    - 範囲: Regional
    - プロトコル: TCP
    - ポート: 9092 -proxy でブートストラップポートの 1 つを選択できます。
プライベートサービス接続>公開サービスに進みます。
- ロードバランサータイプ: Internal passthrough Network Load Balancer
- 内部ロードバランサ: kafka-proxy-lb
- サービス名: kafka-proxy-psc
- サブネット: RESERVE NEW SUBNET
  - 名前: proxy-psc-subnet
  - VPC ネットワーク: ネットワーク
  - リージョン: us-west1
  - IPv4範囲: ネットワーク計画に基づいてCIDRを設定します
- 承認されたプロジェクト: 前提条件で取得したTiDB Cloudの Google Cloud プロジェクト (例: tidbcloud-prod-000 )。
kafka-proxy-pscの詳細ページに移動します。TiDB TiDB Cloudでこの PSC に接続するために使用するService attachment (例: projects/tidbcloud-dp-stg-000/regions/us-west1/serviceAttachments/kafka-proxy-psc ) を書き留めます。
VPC ネットワークの詳細ページに移動します。すべてのブローカーの PSC トラフィックを許可するファイアウォールルールを追加します。
- 名前: allow-proxy-psc-traffic
- 交通方向: Ingress
- 試合のアクション: Allow
- 対象: ネットワーク内のすべてのインスタンス
- ソースフィルター: IPv4 ranges
- ソース IPv4 範囲: proxy-psc-subnet の CIDR
- プロトコルとポート: すべて許可

ステップ3. TiDB Cloudから接続する

TiDB Cloudコンソールに戻り、クラスターがPrivate Service Connectによって Kafka クラスターに接続するための changefeed を作成します。詳細については、 Apache Kafka にシンクする参照してください。
「ChangeFeed ターゲットの構成」 > 「接続方法」 > 「プライベートサービス接続」に進んだ後、次のフィールドに対応する値を入力し、必要に応じて他のフィールドを入力します。
- Kafka アドバタイズリスナーパターン: abc . 前提条件でKafka アドバタイズリスナーパターンを生成するために使用する一意のランダム文字列と同じです。
- サービスアタッチメント: PSC の kafka-proxy サービスアタッチメント (例: projects/tidbcloud-dp-stg-000/regions/us-west1/serviceAttachments/kafka-proxy-psc 。
- ブートストラップポート: 9092,9093,9094
Apache Kafka にシンクするのガイドラインに従ってください。

FAQ

2 つの異なるTiDB Cloudプロジェクトから同じ Kafka Private Service Connect サービスに接続するにはどうすればよいですか?

すでにこのドキュメントの手順に従って最初のプロジェクトからの接続を正常に設定しており、2 番目のプロジェクトから 2 番目の接続を設定する場合は、次のようにして 2 つの異なるTiDB Cloudプロジェクトから同じ Kafka Private Service Connect サービスに接続できます。

PSC ポートマッピングによって Kafka PSC を設定する場合は、次の手順を実行します。
1. このドキュメントの冒頭の指示に従ってください。ステップ1. Kafkaクラスタをセットアップするに進んだら、実行中の Kafka クラスターを再構成するセクションに従って、別の EXTERNAL リスナーとアドバタイズされたリスナーのグループを作成します。 EXTERNAL2という名前を付けることができます。 EXTERNAL2のポート範囲は EXTERNAL と重複できないことに注意してください。
2. ブローカーを再構成した後、ネットワークエンドポイントグループに別のネットワークエンドポイントグループを追加し、ポート範囲をEXTERNAL2のリスナーにマップします。
3. 新しい変更フィードを作成するには、次の入力でTiDB Cloud接続を構成します。
  - 新しいブートストラップポート
  - 新しい Kafka アドバタイズリスナーパターン
  - 同じサービスアタッチメント
Kafka-proxy によるセルフホスト型 Kafka プライベートサービス接続をセットアップするの場合は、新しい Kafka アドバタイズリスナーパターンを使用して、最初から新しい Kafka プロキシ PSC を作成します。

Google Cloud でセルフホスト型 Kafka プライベート サービス接続を設定する

前提条件

PSC ポート マッピングによるセルフホスト型 Kafka Private Service Connect サービスの設定

ステップ1. Kafkaクラスターをセットアップする

新しい Kafka クラスターをデプロイ

実行中の Kafka クラスターを再構成する

ステップ2. Kafkaクラスターをプライベートサービス接続として公開する

ステップ3. TiDB Cloudから接続する

Kafka-proxy によるセルフホスト型 Kafka プライベート サービス接続の設定

ステップ1. Kafka-proxyを設定する

ステップ 2. Kafka-proxy をプライベート サービス接続サービスとして公開する

ステップ3. TiDB Cloudから接続する

FAQ

2 つの異なるTiDB Cloudプロジェクトから同じ Kafka Private Service Connect サービスに接続するにはどうすればよいですか?

このページは役に立ちましたか？

Google Cloud でセルフホスト型 Kafka プライベートサービス接続を設定する

PSC ポートマッピングによるセルフホスト型 Kafka Private Service Connect サービスの設定

Kafka-proxy によるセルフホスト型 Kafka プライベートサービス接続の設定

ステップ 2. Kafka-proxy をプライベートサービス接続サービスとして公開する