- 关于 TiDB
- 快速上手
- 部署集群
- 数据迁移
- 运维操作
- 升级 TiDB 版本
- 扩缩容
- 备份与恢复
- 使用 BR 工具(推荐)
- 读取历史数据
- 修改时区
- 日常巡检
- TiFlash 常用运维操作
- TiUP 常用运维操作
- 在线修改集群配置
- 监控与告警
- 故障诊断
- 性能调优
- 系统调优
- 软件调优
- SQL 性能调优
- SQL 性能调优概览
- 理解 TiDB 执行计划
- SQL 优化流程
- 控制执行计划
- 教程
- TiDB 生态工具
- 参考指南
- 架构
- 监控指标
- 安全加固
- 权限
- SQL
- SQL 语言结构和语法
- SQL 语句
ADD COLUMN
ADD INDEX
ADMIN
ADMIN CANCEL DDL
ADMIN CHECKSUM TABLE
ADMIN CHECK [TABLE|INDEX]
ADMIN SHOW DDL [JOBS|QUERIES]
ALTER DATABASE
ALTER INDEX
ALTER INSTANCE
ALTER TABLE
ALTER USER
ANALYZE TABLE
BACKUP
BEGIN
CHANGE COLUMN
CHANGE DRAINER
CHANGE PUMP
COMMIT
CREATE [GLOBAL|SESSION] BINDING
CREATE DATABASE
CREATE INDEX
CREATE ROLE
CREATE SEQUENCE
CREATE TABLE LIKE
CREATE TABLE
CREATE USER
CREATE VIEW
DEALLOCATE
DELETE
DESC
DESCRIBE
DO
DROP [GLOBAL|SESSION] BINDING
DROP COLUMN
DROP DATABASE
DROP INDEX
DROP ROLE
DROP SEQUENCE
DROP STATS
DROP TABLE
DROP USER
DROP VIEW
EXECUTE
EXPLAIN ANALYZE
EXPLAIN
FLASHBACK TABLE
FLUSH PRIVILEGES
FLUSH STATUS
FLUSH TABLES
GRANT <privileges>
GRANT <role>
INSERT
KILL [TIDB]
LOAD DATA
LOAD STATS
MODIFY COLUMN
PREPARE
RECOVER TABLE
RENAME INDEX
RENAME TABLE
REPLACE
RESTORE
REVOKE <privileges>
REVOKE <role>
ROLLBACK
SELECT
SET DEFAULT ROLE
SET [NAMES|CHARACTER SET]
SET PASSWORD
SET ROLE
SET TRANSACTION
SET [GLOBAL|SESSION] <variable>
SHOW [BACKUPS|RESTORES]
SHOW ANALYZE STATUS
SHOW [GLOBAL|SESSION] BINDINGS
SHOW BUILTINS
SHOW CHARACTER SET
SHOW COLLATION
SHOW [FULL] COLUMNS FROM
SHOW CONFIG
SHOW CREATE SEQUENCE
SHOW CREATE TABLE
SHOW CREATE USER
SHOW DATABASES
SHOW DRAINER STATUS
SHOW ENGINES
SHOW ERRORS
SHOW [FULL] FIELDS FROM
SHOW GRANTS
SHOW INDEX [FROM|IN]
SHOW INDEXES [FROM|IN]
SHOW KEYS [FROM|IN]
SHOW MASTER STATUS
SHOW PLUGINS
SHOW PRIVILEGES
SHOW [FULL] PROCESSSLIST
SHOW PROFILES
SHOW PUMP STATUS
SHOW SCHEMAS
SHOW STATS_HEALTHY
SHOW STATS_HISTOGRAMS
SHOW STATS_META
SHOW STATUS
SHOW TABLE NEXT_ROW_ID
SHOW TABLE REGIONS
SHOW TABLE STATUS
SHOW [FULL] TABLES
SHOW [GLOBAL|SESSION] VARIABLES
SHOW WARNINGS
SHUTDOWN
SPLIT REGION
START TRANSACTION
TRACE
TRUNCATE
UPDATE
USE
- 数据类型
- 函数与操作符
- 聚簇索引
- 约束
- 生成列
- SQL 模式
- 事务
- 垃圾回收 (GC)
- 视图
- 分区表
- 字符集和排序规则
- 系统表
mysql
- INFORMATION_SCHEMA
- Overview
ANALYZE_STATUS
CHARACTER_SETS
CLUSTER_CONFIG
CLUSTER_HARDWARE
CLUSTER_INFO
CLUSTER_LOAD
CLUSTER_LOG
CLUSTER_SYSTEMINFO
COLLATIONS
COLLATION_CHARACTER_SET_APPLICABILITY
COLUMNS
DDL_JOBS
ENGINES
INSPECTION_RESULT
INSPECTION_RULES
INSPECTION_SUMMARY
KEY_COLUMN_USAGE
METRICS_SUMMARY
METRICS_TABLES
PARTITIONS
PROCESSLIST
SCHEMATA
SEQUENCES
SESSION_VARIABLES
SLOW_QUERY
STATISTICS
TABLES
TABLE_CONSTRAINTS
TABLE_STORAGE_STATS
TIDB_HOT_REGIONS
TIDB_INDEXES
TIDB_SERVERS_INFO
TIFLASH_REPLICA
TIKV_REGION_PEERS
TIKV_REGION_STATUS
TIKV_STORE_STATUS
USER_PRIVILEGES
VIEWS
METRICS_SCHEMA
- UI
- CLI
- 命令行参数
- 配置文件参数
- 系统变量
- 存储引擎
- TiKV
- TiFlash
- TiUP
- 遥测
- 错误码
- 通过拓扑 label 进行副本调度
- 常见问题解答 (FAQ)
- 术语表
- 版本发布历史
TiCDC 重要监控指标详解
使用 TiUP 部署 TiDB 集群时,一键部署的监控系统面板包含 TiCDC 面板。本文档对 TiCDC 监控面板上的各项指标进行详细说明。在日常运维中,运维人员可通过观察 TiCDC 面板上的指标了解 TiCDC 当前的状态。
本文档的对指标的介绍基于以下同步任务,即使用默认配置同步数据到 MySQL。
cdc cli changefeed create --pd=http://10.0.10.25:2379 --sink-uri="mysql://root:123456@127.0.0.1:3306/" --changefeed-id="simple-replication-task"
下图显示了 TiCDC Dashboard 各监控面板:
各监控面板说明如下:
- Server:TiDB 集群中 TiKV 节点和 TiCDC 节点的概要信息
- Changefeed:TiCDC 同步任务的详细信息
- Events:TiCDC 内部数据流转的详细信息
- TiKV:TiKV 中和 TiCDC 相关的详细信息
Server 面板
Server 面板示例如下:
Server 面板的各指标说明如下:
- Uptime:TiKV 节点和 TiCDC 节点已经运行的时间
- Goroutine count:TiCDC 节点 Goroutine 的个数
- Open FD count:TiCDC 节点打开的文件句柄个数
- Ownership:TiCDC 集群中节点的当前状态
- Ownership history:TiCDC 集群中 Owner 节点的历史记录
- CPU usage:TiCDC 节点使用的 CPU
- Memory usage:TiCDC 节点使用的内存
Changefeed 面板
Changefeed 面板示例如下:
Changefeed 面板的各指标说明如下:
- Changefeed table count:一个同步任务中分配到各个 TiCDC 节点同步的数据表个数
- Processor resolved ts:TiCDC 节点内部状态中已同步的时间点
- Table resolved ts:同步任务中各数据表的同步进度
- Changefeed checkpoint:同步任务同步到下游的进度,正常情况下绿柱应和黄线相接
- PD etcd requests/s:TiCDC 节点每秒向 PD 读写数据的次数
- Exit error count:每分钟内导致同步中断的错误发生次数
- Changefeed checkpoint lag:同步任务上下游数据的进度差(以时间计算)
- Changefeed resolved ts lag:TiCDC 节点内部同步状态与上游的进度差(以时间计算)
- Flush sink duration:TiCDC 异步刷写数据入下游的耗时直方图
- Flush sink duration percentile:每秒钟中 95%、99% 和 99.9% 的情况下,TiCDC 异步刷写数据入下游所花费的时间
- Sink write duration:TiCDC 将一个事务的更改写到下游的耗时直方图
- Sink write duration percentile:每秒钟中 95%、99% 和 99.9% 的情况下,TiCDC 将一个事务的更改写到下游所花费的时间
- MySQL sink conflict detect duration:MySQL 写入冲突检测耗时直方图
- MySQL sink conflict detect duration percentile:每秒钟中 95%、99% 和 99.9% 的情况下,MySQL 写入冲突检测耗时
- MySQL sink worker load:TiCDC 节点中写 MySQL 线程的负载情况
Events 面板
Events 面板示例如下:
Events 面板的各指标说明如下:
- Eventfeed count:TiCDC 节点中 Eventfeed RPC 的个数
- Event size percentile:每秒钟中 95% 和 99.9% 的情况下,TiCDC 收到的来自 TiKV 的数据变更消息大小
- Eventfeed error/m:TiCDC 节点中每分钟 Eventfeed RPC 遇到的错误个数
- KV client receive events/s:TiCDC 节点中 KV client 模块每秒收到来自 TiKV 的数据变更个数
- Puller receive events/s:TiCDC 节点中 Puller 模块每秒收到来自 KV client 模块的数据变更个数
- Puller output events/s:TiCDC 节点中 Puller 模块每秒输出到 Sorter 模块的数据变更个数
- Sink flush rows/s:TiCDC 节点每秒写到下游的数据变更的个数
- Puller buffer size:TiCDC 节点中缓存在 Puller 模块中的数据变更个数
- Entry sorter buffer size:TiCDC 节点中缓存在 Sorter 模块中的数据变更个数
- Processor/Mounter buffer size:TiCDC 节点中缓存在 Processor 模块和 Mounter 模块中的数据变更个数
- Sink row buffer size:TiCDC 节点中缓存在 Sink 模块中的数据变更个数
- Entry sorter sort duration:TiCDC 节点对数据变更进行排序的耗时直方图
- Entry sorter sort duration percentile:每秒钟中 95%,99% 和 99.9% 的情况下,TiCDC 排序数据变更所花费的时间
- Entry sorter merge duration:TiCDC 节点合并排序后的数据变更的耗时直方图
- Entry sorter merge duration percentile:每秒钟中 95%,99% 和 99.9% 的情况下,TiCDC 合并排序后的数据变更所花费的时间
- Mounter unmarshal duration:TiCDC 节点解码数据变更的耗时直方图
- Mounter unmarshal duration percentile:每秒钟中 95%,99% 和 99.9% 的情况下,TiCDC 解码数据变更所花费的时间
- KV client dispatch events/s:TiCDC 节点内部 KV client 模块每秒分发数据变更的个数
- KV client batch resolved size:TiKV 批量发给 TiCDC 的 resolved ts 消息的大小
TiKV 面板
TiKV 面板示例如下:
TiKV 面板的各指标说明如下:
- CDC endpoint CPU:TiKV 节点上 CDC endpoint 线程使用的 CPU
- CDC worker CPU:TiKV 节点上 CDC worker 线程使用的 CPU
- Min resolved ts:TiKV 节点上最小的 resolved ts
- Min resolved region:TiKV 节点上最小的 resolved ts 的 Region ID
- Resolved ts lag duration percentile:TiKV 节点上最小的 resolved ts 与当前时间的差距
- Initial scan duration:TiKV 节点与 TiCDC 建立链接时增量扫的耗时直方图
- Initial scan duration percentile:每秒钟中 95%、99% 和 99.9% 的情况下,TiKV 节点增量扫的耗时
- Memory without block cache:TiKV 节点在减去 RocksDB block cache 后使用的内存
- CDC pending bytes in memory:TiKV 节点中 CDC 模块使用的内存
- Captured region count:TiKV 节点上捕获数据变更的 Region 个数