📣
TiDB Cloud Essential はパブリックプレビュー中です。このページは自動翻訳されたものです。原文はこちらからご覧ください。

TiCDC ChangefeedsのCLIとコンフィグレーションパラメータ



変更フィードCLIパラメータ

このセクションでは、TiCDCチェンジフィードのコマンドラインパラメータについて、レプリケーション(チェンジフィード)タスクの作成方法を示すことで紹介します。

cdc cli changefeed create --server=http://10.0.10.25:8300 --sink-uri="mysql://root:123456@127.0.0.1:3306/" --changefeed-id="simple-replication-task"
Create changefeed successfully! ID: simple-replication-task Info: {"upstream_id":7178706266519722477,"namespace":"default","id":"simple-replication-task","sink_uri":"mysql://root:xxxxx@127.0.0.1:4000/?time-zone=","create_time":"2025-11-27T15:05:46.679218+08:00","start_ts":438156275634929669,"engine":"unified","config":{"case_sensitive":false,"force_replicate":false,"ignore_ineligible_table":false,"check_gc_safe_point":true,"enable_sync_point":true,"bdr_mode":false,"sync_point_interval":30000000000,"sync_point_retention":3600000000000,"filter":{"rules":["test.*"],"event_filters":null},"mounter":{"worker_num":16},"sink":{"protocol":"","schema_registry":"","csv":{"delimiter":",","quote":"\"","null":"\\N","include_commit_ts":false},"column_selectors":null,"transaction_atomicity":"none","encoder_concurrency":16,"terminator":"\r\n","date_separator":"none","enable_partition_separator":false},"consistent":{"level":"none","max_log_size":64,"flush_interval":2000,"storage":""}},"state":"normal","creator_version":"v8.5.4"}
  • --changefeed-id : レプリケーションタスクのID。形式は^[a-zA-Z0-9]+(\-[a-zA-Z0-9]+)*$正規表現に一致する必要があります。このIDが指定されていない場合、TiCDCは自動的にUUID(バージョン4形式)をIDとして生成します。

  • --sink-uri : レプリケーション タスクのダウンストリーム アドレス。 --sink-uriは、次の形式に従って設定します。現在、このスキームはmysqltidb 、およびkafkaをサポートしています。

    [scheme]://[userinfo@][host]:[port][/path]?[query_parameters]

    シンク URI パラメータに! * ' ( ) ; : @ & = + $ , / ? % # [ ]などの特殊文字が含まれている場合は、 URIエンコーダーのように特殊文字をエスケープする必要があります。

  • --start-ts : 変更フィードの開始TSOを指定します。TiCDCクラスタはこのTSOからデータの取得を開始します。デフォルト値は現在時刻です。

  • --target-ts : 変更フィードの終了TSOを指定します。このTSOに達すると、TiCDCクラスタはデータのプルを停止します。デフォルト値は空で、これはTiCDCが自動的にデータのプルを停止しないことを意味します。

  • --config : 変更フィードの設定ファイルを指定します。

変更フィードの設定パラメータ

このセクションでは、レプリケーションタスクの設定について説明します。

memory-quota

  • シンクマネージャがキャプチャサーバーで使用できるメモリ割り当て量(バイト単位)を指定します。この値を超過した場合、超過した部分はGoランタイムによって再利用されます。
  • デフォルト値: 1073741824 (1 GiB)

case-sensitive

  • 構成ファイル内のデータベース名とテーブルが大文字と小文字を区別するかどうかを指定します。v6.5.6、v7.1.3、v7.5.0 以降、デフォルト値はtrueからfalseに変更されます。
  • この設定項目は、フィルターとシンクに関連する設定に影響します。
  • デフォルト値: false

force-replicate

enable-sync-point v6.3.0で追加

  • Syncpoint機能を有効にするかどうかを指定します。この機能はバージョン6.3.0以降でサポートされており、デフォルトでは無効になっています。
  • バージョン6.4.0以降、 SYSTEM_VARIABLES_ADMINまたはSUPERの権限を持つチェンジフィードのみがTiCDC Syncpoint機能を使用できます。
  • この設定項目は、ダウンストリームがTiDBの場合にのみ有効になります。
  • デフォルト値: false

sync-point-interval

  • Syncpointがアップストリームとダウンストリームのスナップショットを同期させる間隔を指定します。
  • この設定項目は、ダウンストリームがTiDBの場合にのみ有効になります。
  • 形式は"h m s"です。例えば、 "1h30m30s"です。
  • デフォルト値: "10m"
  • 最小値: "30s"

sync-point-retention

  • Syncpointがダウンストリームテーブルにデータを保持する期間を指定します。この期間を超えると、データは削除されます。
  • この設定項目は、ダウンストリームがTiDBの場合にのみ有効になります。
  • 形式は"h m s"です。例えば、 "24h30m30s"です。
  • デフォルト値: "24h"

sql-mode v6.5.6、v7.1.3、v7.5.0 で新たに追加されました。

  • DDLステートメントを解析する際に使用するSQLモードを指定します。複数のモードを指定する場合は、カンマで区切ります。
  • デフォルト値: "ONLY_FULL_GROUP_BY,STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION" 。これはTiDBのデフォルトのSQLモードと同じです。

bdr-mode

  • TiCDC を使用して BDR (双方向レプリケーション) クラスターをセットアップするには、このパラメーターをtrueに変更し、TiDB クラスターを BDR モードに設定します。詳細については、 双方向レプリケーション参照してください。
  • デフォルト値: false 。双方向レプリケーション(BDR)モードが有効になっていないことを示します。

changefeed-error-stuck-duration

  • 内部エラーや例外が発生した場合に、チェンジフィードが自動的に再試行できる期間を指定します。
  • 変更フィード内で内部エラーまたは例外が発生し、このパラメータで設定された期間よりも長く継続した場合、変更フィードは失敗状態になります。
  • 変更フィードが障害状態になった場合は、リカバリのために変更フィードを手動で再起動する必要があります。
  • 形式は"h m s"です。例えば、 "1h30m30s"です。
  • デフォルト値: "30m"

マウンター

worker-num

  • マウンターがKVデータをデコードする際に使用するスレッド数を指定します。
  • デフォルト値: 16

フィルター

ignore-txn-start-ts

  • 指定されたstart_tsのトランザクションを無視します。

rules

  • フィルタルールを指定します。詳細については、構文を参照してください。

フィルター.イベントフィルター

詳細については、 イベントフィルタルールを参照してください。

matcher
  • matcherは許可リストです。 matcher = ["test.worker"]は、このルールがworkerデータベース内のtestテーブルにのみ適用されることを意味します。
ignore-event
  • ignore-event = ["insert"]INSERTイベントを無視します。
  • ignore-event = ["drop table", "delete"]DROP TABLE DDL イベントとDELETE DML イベントを無視します。 TiDB でクラスタ化インデックス列の値が更新されると、TiCDC はUPDATEイベントをDELETEイベントとINSERTイベントに分割することに注意してください。 TiCDC はこれらのイベントをUPDATEイベントとして識別できないため、これらのイベントを正しくフィルタリングできません。
ignore-sql
  • ignore-sql = ["^drop", "add column"] DROPで始まる、またはADD COLUMNを含む DDL を無視します。
ignore-delete-value-expr
  • ignore-delete-value-expr = "name = 'john'"は、条件DELETEを含むname = 'john' DML を無視します。
ignore-insert-value-expr
  • ignore-insert-value-expr = "id >= 100"は、条件INSERTを含むid >= 100 DML を無視します。
ignore-update-old-value-expr
  • ignore-update-old-value-expr = "age < 18"は、古い値にUPDATEが含まれるage < 18 DML を無視します。
ignore-update-new-value-expr
  • ignore-update-new-value-expr = "gender = 'male'"は、新しい値にUPDATEが含まれるgender = 'male' DML を無視します。

スケジューラ

enable-table-across-nodes

  • リージョンごとに、複数のTiCDCノードにテーブルを割り当ててレプリケーションを実行します。

  • TiCDCクラシックアーキテクチャでは、この構成項目は Kafka 変更フィードでのみ有効であり、MySQL 変更フィードではサポートされません。

  • TiCDCの新アーキテクチャでは、この設定項目はあらゆる種類のダウンストリーム変更フィードで機能します。詳細については、 新機能を参照してください。

  • enable-table-across-nodesが有効になっている場合、割り当てモードは2つあります。

    1. リージョン数に基づいてテーブルを割り当て、各TiCDCノードがほぼ同数のリージョンを処理するようにします。テーブルのリージョン数がregion-thresholdの値を超えると、そのテーブルはレプリケーションのために複数のノードに割り当てられます。
    2. 書き込みトラフィックに基づいてテーブルを割り当て、各TiCDCノードがほぼ同じ数の変更行を処理するようにします。この割り当ては、テーブル内の1分あたりの変更行数がwrite-key-thresholdの値を超えた場合にのみ有効になります。

    2 つのモードのうち、いずれか 1 つだけを設定すれば十分です。 region-thresholdwrite-key-thresholdの両方が設定されている場合、TiCDC はトラフィック割り当てモード、つまりwrite-key-thresholdを優先します。

  • デフォルト値はfalseです。この機能を有効にするには、 trueに設定してください。

  • デフォルト値: false

region-count-per-span v8.5.4の新機能)

  • TiCDCの新アーキテクチャで紹介されました。チェンジフィードの初期化中に、TiCDC はこのパラメーターに従って分割条件を満たすテーブルを分割します。分割後、各サブテーブルには最大でregion-count-per-span個のリージョンが含まれます。
  • デフォルト値: 100

region-threshold

write-key-threshold

  • デフォルト値: 0 。これは、トラフィック割り当てモードがデフォルトでは使用されないことを意味します。

シンク

dispatchers

  • MQタイプのシンクの場合、ディスパッチャを使用してイベントディスパッチャを設定できます。
  • バージョン6.1.0以降、TiDBはパーティションとトピックという2種類のイベントディスパッチャをサポートしています。
  • マッチャーのマッチング構文は、フィルタルールの構文と同じです。
  • この設定項目は、ダウンストリームがMQの場合にのみ有効になります。
  • ダウンストリーム MQ が Pulsar の場合、 partitionのルーティング ルールがtsindex-valuetable 、またはdefaultにも指定されていない場合、各 Pulsar メッセージは、キーとして設定した文字列を使用してルーティングされます。たとえば、マッチャーのルーティング ルールを文字列codeとして指定した場合、そのマッチャーに一致するすべての Pulsar メッセージはcodeをキーとしてルーティングされます。

column-selectors v7.5.0の新機能)

  • レプリケーション対象とする特定の列を選択します。この設定は、ダウンストリームがKafkaの場合にのみ有効です。

protocol

  • メッセージのエンコードに使用されるプロトコル形式を指定します。
  • この設定項目は、ダウンストリームがKafka、Pulsar、またはstorageサービスの場合にのみ有効になります。
  • ダウンストリームがKafkaの場合、プロトコルはcanal-json、avro、debezium、open-protocol、またはsimpleのいずれかになります。
  • ダウンストリームがPulsarの場合、プロトコルはcanal-jsonのみとなります。
  • ダウンストリームがstorageサービスの場合、プロトコルはcanal-jsonまたはcsvのみとなります。

delete-only-output-handle-key-columns v7.2.0の新機能

  • DELETEイベントの出力を指定します。このパラメータは、canal-jsonおよびopen-protocolプロトコルでのみ有効です。
  • このパラメータはforce-replicateと互換性がありません。このパラメータとforce-replicateの両方がtrueに設定されている場合、TiCDC は変更フィードを作成する際にエラーを報告します。
  • Avroプロトコルはこのパラメータによって制御されず、常に主キー列または一意インデックス列のみを出力します。
  • CSVプロトコルはこのパラメータによって制御されず、常にすべての列を出力します。
  • デフォルト値: falseこれは、すべての列を出力することを意味します。
  • trueに設定すると、主キー列または一意インデックス列のみが出力されます。

schema-registry

  • スキーマレジストリのURLを指定します。
  • この設定項目は、ダウンストリームがMQの場合にのみ有効になります。

encoder-concurrency

  • データのエンコード時に使用するエンコーダースレッドの数を指定します。
  • この設定項目は、ダウンストリームがMQの場合にのみ有効になります。
  • デフォルト値: 32

enable-kafka-sink-v2

  • kafka-goシンクライブラリを使用するkafka-sink-v2を有効にするかどうかを指定します。
  • この設定項目は、ダウンストリームがMQの場合にのみ有効になります。
  • デフォルト値: false

only-output-updated-columns v7.1.0の新機能

  • 更新された列のみを出力するかどうかを指定します。
  • この設定項目は、open-protocolとcanal-jsonを使用するMQダウンストリームにのみ適用されます。
  • デフォルト値: false

terminator

  • この構成項目は、データをstorageシンクにレプリケートする場合にのみ使用され、MQまたはMySQLシンクにデータをレプリケートする場合は無視できます。
  • 2つのデータ変更イベントを区切るために使用される行終端文字を指定します。
  • デフォルト値: "" 、つまり\r\nが使用されます。

date-separator

  • ファイル ディレクトリで使用される日付区切り文字のタイプを指定します。詳細については、 データ変更記録参照してください。
  • この設定項目は、ダウンストリームがstorageサービスである場合にのみ有効になります。
  • デフォルト値: day 、ファイルを日付ごとに分割することを意味します。
  • 値のオプション: noneyearmonthday

enable-partition-separator

  • パーティションを区切り文字として使用するかどうかを制御します。
  • この設定項目は、ダウンストリームがstorageサービスである場合にのみ有効になります。
  • デフォルト値: true 。これは、テーブル内のパーティションが別々のディレクトリに保存されることを意味します。
  • この設定は将来のバージョンで非推奨となり、 trueに強制的に設定されますのでご注意ください。下流のパーティションテーブルでのデータ損失を防ぐため、この設定はデフォルト値のままにしておくことをお勧めします。詳細については、 第11979号を参照してください。使用例については、データデータ変更記録参照してください。

debezium-disable-schema

  • スキーマ情報の出力を無効にするかどうかを制御します。
  • デフォルト値: false 。これは、スキーマ情報の出力を有効にすることを意味します。
  • このパラメータは、シンクタイプがMQで、出力プロトコルがDebeziumの場合にのみ有効です。

sink.csv はv6.5.0 で追加されました。

バージョン6.5.0以降、TiCDCはデータ変更をCSV形式でstorageサービスに保存することをサポートしています。データをMQまたはMySQLシンクにレプリケートする場合は、以下の設定は無視してください。

delimiter
  • CSVファイル内のフィールドを区切る文字を指定します。値はASCII文字である必要があります。
  • デフォルト値: ,
quote
  • CSVファイル内のフィールドを囲むために使用する引用符を指定します。値が空の場合は、引用符は使用されません。
  • デフォルト値: "
null
  • CSV列がNULLの場合に表示される文字を指定します。
  • デフォルト値: \N
include-commit-ts
  • CSV行にコミットTを含めるかどうかを制御します。
  • デフォルト値: false
binary-encoding-method
  • バイナリデータのエンコード方法を指定します。
  • デフォルト値: base64
  • 値オプション: base64hex
output-handle-key
  • ハンドルキー情報を出力するかどうかを制御します。この設定パラメータは内部実装専用であるため、設定することは推奨されません。
  • デフォルト値: false
output-old-value
  • 行データが変更される前の値を出力するかどうかを制御します。デフォルト値はfalseです。
  • 有効にすると( trueに設定すると)、 UPDATEイベントは 2 行のデータを出力します。1 行目は、変更前のデータを出力するDELETEイベントです。2 行目は、変更後のデータを出力するINSERTイベントです。
  • 有効にすると、データ変更のある列の前に"is-update"列が追加されます。この追加された列は、現在の行のデータ変更がUPDATEイベントによるものか、元のINSERTイベントまたはDELETEイベントによるものかを識別するために使用されます。現在の行のデータ変更がUPDATEイベントによるものである場合、 "is-update"列の値はtrueになります。それ以外の場合は、 falseになります。
  • デフォルト値: false

v8.0.0 以降、TiCDC はシンプル メッセージ エンコーディング プロトコルをサポートします。以下は、Simple プロトコルの構成パラメータです。プロトコルの詳細については、 TiCDCシンプルプロトコルを参照してください。

以下の設定パラメータは、ブートストラップメッセージの送信動作を制御します。

send-bootstrap-interval-in-sec

  • ブートストラップメッセージを送信する時間間隔を秒単位で制御します。
  • デフォルト値: 120 。これは、各テーブルに対して120秒ごとにブートストラップメッセージが送信されることを意味します。
  • 単位:秒

send-bootstrap-in-msg-count

  • ブートストラップを送信するメッセージ間隔をメッセージ数で制御します。
  • デフォルト値: 10000 。これは、各テーブルで10000行変更メッセージごとにブートストラップメッセージが送信されることを意味します。
  • ブートストラップ メッセージの送信を無効にする場合は、 send-bootstrap-interval-in-secsend-bootstrap-in-msg-countの両方を0に設定してください。

send-bootstrap-to-all-partition

  • ブートストラップメッセージをすべてのパーティションに送信するかどうかを制御します。
  • falseに設定すると、ブートストラップメッセージは対応するテーブルトピックの最初のパーティションにのみ送信されます。
  • デフォルト値: true 。これは、ブートストラップメッセージが対応するテーブルトピックのすべてのパーティションに送信されることを意味します。

sink.kafka-config.codec-config

encoding-format
  • Simpleプロトコルメッセージのエンコード形式を制御します。現在、Simpleプロトコルメッセージはjsonavroエンコード形式をサポートしています。
  • デフォルト値: json
  • 値のオプション: jsonavro

シンクを開く

output-old-value
  • 行データが変更される前に値を出力するかどうかを制御します。デフォルト値は true です。無効にすると、 UPDATEイベントは「p」フィールドを出力しません。
  • デフォルト値: true

シンク.デベジウム

output-old-value
  • 行データが変更される前の値を出力するかどうかを制御します。デフォルト値は true です。無効にすると、 UPDATEイベントは「変更前」フィールドを出力しません。
  • デフォルト値: true

一貫性のある

REDO ログを使用する場合の変更フィードのレプリケーション整合性構成を指定します。詳細については、 最終的には災害シナリオにおける一貫した再現参照してください。

注:整合性関連の設定項目は、ダウンストリームがデータベースであり、かつリドゥログ機能が有効になっている場合にのみ有効になります。

level

  • データの一貫性レベル。 "none"は、リドゥログが無効になっていることを意味します。
  • デフォルト値: "none"
  • 値のオプション: "none""eventual"

max-log-size

  • 最大リドゥログサイズ。
  • デフォルト値: 64
  • 単位: MiB

flush-interval

  • リドゥログのフラッシュ間隔。
  • デフォルト値: 2000
  • 単位:ミリ秒

storage

  • リドゥログのstorageURI。
  • デフォルト値: ""

use-file-backend

  • リドゥログをローカルファイルに保存するかどうかを指定します。
  • デフォルト値: false

encoding-worker-num

  • リドゥモジュール内のエンコードワーカーとデコードワーカーの数。
  • デフォルト値: 16

flush-worker-num

  • 再実行モジュール内のフラッシングワーカーの数。
  • デフォルト値: 8

compression v6.5.6、v7.1.3、v7.5.1、v7.6.0で新たに追加されました。

  • リドゥログファイルを圧縮する動作。
  • デフォルト値: "" 、これは圧縮なしを意味します。
  • 値のオプション: """lz4"

flush-concurrencyは、v6.5.6、v7.1.3、v7.5.1、およびv7.6.0で追加されました。

  • 単一のリドゥファイルをアップロードする際の同時実行数。
  • デフォルト値: 1 。これは同時実行が無効になっていることを意味します。

誠実さ

integrity-check-level

  • 単一行データに対するチェックサム検証を有効にするかどうかを制御します。
  • デフォルト値: "none"これは、機能を無効にすることを意味します。
  • 値のオプション: "none""correctness"

corruption-handle-level

  • 単一行データのチェックサム検証が失敗した場合の変更フィードのログレベルを指定します。
  • デフォルト値: "warn"
  • 値のオプション: "warn""error"

sink.kafka-config

以下の設定項目は、ダウンストリームがKafkaの場合にのみ有効になります。

sasl-mechanism

  • Kafka SASL認証のメカニズムを指定します。
  • デフォルト値: ""これは、SASL認証が使用されていないことを示します。

sasl-oauth-client-id

  • Kafka SASL OAUTHBEARER認証におけるクライアントIDを指定します。OAUTHBEARER認証を使用する場合は、このパラメータが必須です。
  • デフォルト値: ""

sasl-oauth-client-secret

  • Kafka SASL OAUTHBEARER認証におけるクライアントシークレットを指定します。OAUTHBEARER認証を使用する場合は、このパラメータが必須です。
  • デフォルト値: ""

sasl-oauth-token-url

  • Kafka SASL OAUTHBEARER認証において、トークンを取得するためのトークンURLを指定します。OAUTHBEARER認証を使用する場合は、このパラメータが必須です。
  • デフォルト値: ""

sasl-oauth-scopes

  • Kafka SASL OAUTHBEARER認証におけるスコープを指定します。OAUTHBEARER認証を使用する場合、このパラメータは省略可能です。
  • デフォルト値: ""

sasl-oauth-grant-type

  • Kafka SASL OAUTHBEARER認証におけるグラントタイプを指定します。OAUTHBEARER認証を使用する場合、このパラメータは省略可能です。
  • デフォルト値: "client_credentials"

sasl-oauth-audience

  • Kafka SASL OAUTHBEARER認証におけるオーディエンスを指定します。OAUTHBEARER認証を使用する場合、このパラメータは省略可能です。
  • デフォルト値: ""

output-raw-change-event

sink.kafka-config.glue-schema-registry-config

以下の設定は、プロトコルとしてAvroを使用し、AWS Glue Schema Registryを使用する場合にのみ必要です。

region="us-west-1" registry-name="ticdc-test" access-key="xxxx" secret-access-key="xxxx" token="xxxx"

詳細については、 TiCDCをAWS Glueスキーマレジストリと統合する参照してください。

sink.pulsar-config

以下のパラメータは、下流側がPulsarの場合にのみ有効になります。

authentication-token

  • Pulsarサーバーでの認証はトークンを使用して行われます。トークンの値を指定してください。

token-from-file

  • Pulsarサーバー認証にトークンを使用する場合は、トークンが格納されているファイルのパスを指定してください。

basic-user-name

  • Pulsarは、基本アカウントとパスワードを使用して本人確認を行います。アカウントを指定してください。

basic-password

  • Pulsarは、基本アカウントとパスワードを使用して本人確認を行います。パスワードを指定してください。

auth-tls-certificate-path

  • Pulsar TLS暗号化認証に使用する証明書のパスを指定します。

auth-tls-private-key-path

  • Pulsar TLS暗号化認証用の秘密鍵のパスを指定します。

tls-trust-certs-file-path

  • Pulsar TLS暗号化認証で使用される信頼済み証明書ファイルへのパスを指定します。

oauth2.oauth2-issuer-url

oauth2.oauth2-audience

oauth2.oauth2-private-key

oauth2.oauth2-client-id

oauth2.oauth2-scope

pulsar-producer-cache-size

  • TiCDCでキャッシュされるPulsarプロデューサーの数を指定します。各Pulsarプロデューサーは1つのトピックに対応します。レプリケートする必要のあるトピックの数がデフォルト値よりも多い場合は、数を増やす必要があります。
  • デフォルト値: 10240

compression-type

  • パルサーデータ圧縮方式。
  • デフォルト値: "" 。これは圧縮が使用されないことを意味します。
  • 値のオプション: "lz4""zlib""zstd"

connection-timeout

  • PulsarクライアントがサーバーとのTCP接続を確立するためのタイムアウト時間。
  • デフォルト値: 5 (秒)

operation-timeout

  • Pulsarクライアントがトピックの作成や購読などの操作を開始するためのタイムアウト時間。
  • デフォルト値: 30 (秒)

batching-max-messages

  • Pulsarプロデューサーが1回のバッチで送信できるメッセージの最大数。
  • デフォルト値: 1000

batching-max-publish-delay

  • Pulsarプロデューサーメッセージがバッチ処理のために保存される間隔。
  • デフォルト値: 10 (ミリ秒)

send-timeout

  • Pulsarプロデューサーがメッセージを送信するまでのタイムアウト時間。
  • デフォルト値: 30 (秒)

output-raw-change-event

sink.cloud-storage-config

worker-count

  • ダウンストリームのクラウドstorageの同時実行性が変更されます。
  • デフォルト値: 16

flush-interval

  • 下流のクラウドstorageにデータを保存する間隔が変更されます。
  • デフォルト値: "2s"

file-size

  • このファイルのバイト数file-sizeを超えると、データ変更ファイルがクラウドstorageに保存されます。
  • デフォルト値: 67108864 、つまり64MiB

file-expiration-days

  • ファイルを保持する期間。これは、 date-separatordayに設定されている場合にのみ有効になります。
  • デフォルト値: 0 。これは、ファイルクリーンアップが無効になっていることを意味します。
  • file-expiration-days = 1file-cleanup-cron-spec = "0 0 0 * * *"を仮定すると、TiCDC は 24 時間を超えて保存されたファイルに対して、毎日 00:00:00 にクリーンアップを実行します。たとえば、2023/12/02 の 00:00:00 に、TiCDC は 2023/12/01 より前に生成されたファイルをクリーンアップしますが、2023/12/01 に生成されたファイルは影響を受けません。

file-cleanup-cron-spec

  • crontabの設定に対応した、スケジュールされたクリーンアップタスクの実行サイクル。
  • フォーマットは<Second> <Minute> <Hour> <Day of the month> <Month> <Day of the week (Optional)>です
  • デフォルト値: "0 0 2 * * *" 。これは、クリーンアップタスクが毎日午前2時に実行されることを意味します。

flush-concurrency

  • 単一ファイルのアップロードにおける同時実行数。
  • デフォルト値: 1 。これは同時実行が無効になっていることを意味します。

output-raw-change-event

このページは役に立ちましたか?