TiCDC 兼容性
本文介绍了与 TiCDC 有关的一系列兼容性问题及其处理方案。
TiCDC 与 TiDB Lightning 的兼容性
TiDB Lightning 支持逻辑导入模式和物理导入模式两种数据导入模式。本章节介绍这两种模式与 TiCDC 的兼容性,以及同时使用 TiDB Lightning 和 TiCDC 时的操作步骤。
在逻辑导入模式下,TiDB Lightning 通过执行 SQL 语句导入数据。此模式与 TiCDC 兼容。你可以按照以下步骤同时使用 TiDB Lightning 逻辑导入模式和 TiCDC 进行数据同步:
在物理导入模式下,TiDB Lightning 通过向 TiKV 插入 SST 文件的方式导入数据。TiCDC 与此模式不兼容,不支持同步通过物理模式导入的数据。如果你需要同时使用 TiDB Lightning 物理导入模式和 TiCDC,可以根据 TiCDC 下游系统的类型选择以下解决方案:
下游系统是 TiDB 集群:
- 使用 TiDB Lightning 分别向上下游 TiDB 集群导入数据,以确保两个集群的数据一致性。
- 创建 changefeed,用于同步后续通过 SQL 写入的增量数据。详情参考创建同步任务。
下游系统不是 TiDB 集群:
- 使用下游系统提供的离线导入工具,将 TiDB Lightning 的输入文件导入到下游系统。
- 创建 changefeed,用于同步后续通过 SQL 写入的增量数据。详情参考创建同步任务。
命令行参数和配置文件兼容性
- TiCDC v4.0.0 中移除了
ignore-txn-commit-ts,添加了ignore-txn-start-ts,使用 start_ts 过滤事务。 - TiCDC v4.0.2 中移除了
db-dbs/db-tables/ignore-dbs/ignore-tables,添加了rules,使用新版的数据库和数据表过滤规则,详细语法参考表库过滤。 - 自 TiCDC v6.2.0 开始,
cdc cli将通过 TiCDC 的 Open API 直接与 TiCDC server 进行交互,而不再需要访问 PD。cdc cli子命令中的--pd参数被废除,增加了--server参数,用于指定 TiCDC Server 地址。请使用--server参数替代--pd参数。 - 从 v6.4.0 开始,TiCDC 使用 Syncpoint 功能需要同步任务拥有下游集群的
SYSTEM_VARIABLES_ADMIN或者SUPER权限。
兼容性问题处理
本节介绍了兼容性相关的问题。
使用 TiCDC v5.0.0-rc 版本的 cdc cli 工具操作 v4.0.x 集群导致不兼容问题
使用 TiCDC v5.0.0-rc 版本的 cdc cli 工具操作 v4.0.x 版本的 TiCDC 集群时,可能会遇到如下异常情况:
- 若 TiCDC 集群版本为 v4.0.8 或以下,使用 v5.0.0-rc 版本的
cdc cli创建同步任务 changefeed 时,可能导致 TiCDC 集群陷入异常状态,导致同步卡住。 - 若 TiCDC 集群版本为 v4.0.9 或以上,使用 v5.0.0-rc 版本的
cdc cli创建同步任务 changefeed,会导致 Old Value 和 Unified Sorter 特性被非预期地默认开启。
处理方案:
使用和 TiCDC 集群版本对应的 cdc 可执行文件进行如下操作:
- 删除使用 v5.0.0-rc 版本创建的 changefeed,例如:
tiup cdc:v4.0.9 cli changefeed remove -c xxxx --pd=xxxxx --force。 - 如果 TiCDC 同步已经卡住,重启 TiCDC 集群,例如:
tiup cluster restart <cluster_name> -R cdc。 - 重新创建 changefeed,例如:
tiup cdc:v4.0.9 cli changefeed create --sink-uri=xxxx --pd=xxx。
sort-dir 及 data-dir 配置项的兼容性说明
sort-dir 配置项用于给 TiCDC 内部的排序器指定临时文件目录,其作用在各版本有过如下兼容性更改:
全局临时表兼容性说明
TiCDC 从 v5.3.0 开始支持全局临时表。
你需要使用 TiCDC v5.3.0 及以上版本同步全局临时表到下游。低于该版本,会导致表定义错误。
如果 TiCDC 的上游集群包含全局临时表,下游集群也必须是 TiDB 5.3.0 及以上版本,否则同步报错。