TiDB 工具功能概览
TiDB 提供了丰富的工具,可以帮助你进行部署运维、数据管理(例如,数据迁移、备份恢复、数据校验)、在 TiKV 上运行 Spark SQL。请根据需要选择适用的工具。
部署运维工具
TiDB 提供了 TiUP 和 TiDB Operator 部署运维工具,满足你在不同系统环境下的部署运维需求。
在物理机或虚拟机上部署运维 TiDB
TiUP
TiUP 是在物理机或虚拟机上的 TiDB 包管理器,管理着 TiDB 的众多的组件,如 TiDB、PD、TiKV 等。当你想要运行 TiDB 生态中任何组件时,只需要执行一行 TiUP 命令即可。
TiUP cluster 是 TiUP 提供的使用 Golang 编写的集群管理组件,通过 TiUP cluster 组件就可以进行日常的运维工作,包括部署、启动、关闭、销毁、弹性扩缩容、升级 TiDB 集群,以及管理 TiDB 集群参数。
基本信息:
- 术语及核心概念
- 使用 TiUP 部署 TiDB 集群
- TiUP 组件管理
- 适用 TiDB 版本:v4.0 及以上
在 Kubernetes 上部署运维 TiDB - TiDB Operator
TiDB Operator 是 Kubernetes 上的 TiDB 集群自动运维系统,提供包括部署、升级、扩缩容、备份恢复、配置变更的 TiDB 全生命周期管理。借助 TiDB Operator,TiDB 可以无缝运行在公有云或自托管的 Kubernetes 集群上。
基本信息:
- TiDB Operator 架构
- 在 Kubernetes 上部署运维 TiDB 快速上手
- 适用 TiDB 版本:v2.1 及以上
数据管理工具
TiDB 提供了丰富的数据管理工具,例如数据迁移、导入导出、备份恢复、增量同步、数据校验等。
数据迁入 - TiDB Data Migration (DM)
TiDB Data Migration (DM) 是将 MySQL/MariaDB 数据迁移到 TiDB 的工具,支持全量数据的迁移和增量数据的复制。
基本信息:
- TiDB DM 的输入:MySQL/MariaDB
- TiDB DM 的输出:TiDB 集群
- 适用 TiDB 版本:所有版本
- Kubernetes 支持:使用 TiDB Operator 在 Kubernetes 上部署 TiDB DM。
如果数据量在 TB 级别以下,推荐直接使用 TiDB DM 迁移 MySQL/MariaDB 数据到 TiDB(迁移的过程包括全量数据的导出导入和增量数据的复制)。
如果数据量在 TB 级别,推荐的迁移步骤如下:
- 使用 Dumpling 导出 MySQL/MariaDB 全量数据。
- 使用 TiDB Lightning 将全量导出数据导入 TiDB 集群。
- 使用 TiDB DM 复制 MySQL/MariaDB 增量数据到 TiDB。
全量导出 - Dumpling
Dumpling 是一个用于从 MySQL/TiDB 进行全量逻辑导出的工具。
基本信息:
- Dumpling 的输入:MySQL/TiDB 集群
- Dumpling 的输出:SQL/CSV 文件
- 适用 TiDB 版本:所有版本
- Kubernetes 支持:尚未支持
全量导入 - TiDB Lightning
TiDB Lightning 是一个用于将全量数据导入到 TiDB 集群的工具。
使用 TiDB Lightning 导入数据到 TiDB 时,有以下模式:
Physical Import Mode
模式:TiDB Lightning 将数据解析为有序的键值对,并直接将其导入 TiKV。这种模式一般用于导入大量的数据(TB 级别)到新集群,但在数据导入过程中集群无法提供正常的服务。Logical Import Mode
模式:以 TiDB/MySQL 作为后端,这种模式相比Physical Import Mode
,导入速度较慢,但是可以在线导入,同时也支持将数据导入到 MySQL。
基本信息:
- TiDB Lightning 的输入:
- Dumpling 输出文件
- 其他格式兼容的 CSV 文件
- 从 Aurora 或者 Hive 导出的 Parquet 文件
- 适用 TiDB 版本:v2.1 及以上
- Kubernetes 支持:使用 TiDB Lightning 快速恢复 Kubernetes 上的 TiDB 集群数据
备份和恢复 - Backup & Restore
Backup & Restore (BR) 是一个对 TiDB 进行分布式备份和恢复的工具,可以高效地对大数据量的 TiDB 集群进行数据备份和恢复。
基本信息:
- 备份输出和恢复输入的文件类型
- 适用 TiDB 版本:v4.0 及以上
- Kubernetes 支持:使用 BR 工具备份 TiDB 集群数据到兼容 S3 的存储,使用 BR 工具恢复 S3 兼容存储上的备份数据
TiDB 增量数据同步 - TiCDC
TiCDC 是一款通过拉取 TiKV 变更日志实现的 TiDB 增量数据同步工具,具有将数据还原到与上游任意 TSO 一致状态的能力,同时提供开放数据协议 (TiCDC Open Protocol),支持其他系统订阅数据变更。
基本信息:
- TiCDC 的输入:TiDB 集群
- TiCDC 的输出:TiDB 集群、MySQL、Kafka、Confluent
- 适用 TiDB 版本:v4.0.6 及以上
TiDB 增量日志同步 - TiDB Binlog
TiDB Binlog 是收集 TiDB 的增量 binlog 数据,并提供准实时同步和备份的工具。该工具可用于 TiDB 集群间的增量数据同步,如将其中一个 TiDB 集群作为另一个 TiDB 集群的从集群。
基本信息:
- TiDB Binlog 的输入:TiDB 集群
- TiDB Binlog 的输出:TiDB 集群、MySQL、Kafka 或者增量备份文件
- 适用 TiDB 版本:v2.1 及以上
- Kubernetes 支持:TiDB Binlog 运维文档,Kubernetes 上的 TiDB Binlog Drainer 配置
数据校验 - sync-diff-inspector
sync-diff-inspector 是一个用于校验 MySQL/TiDB 中两份数据是否一致的工具。该工具还提供了修复数据的功能,可用于修复少量不一致的数据。
基本信息:
- sync-diff-inspector 的输入:TiDB、MySQL
- sync-diff-inspector 的输出:TiDB、MySQL
- 适用 TiDB 版本:所有版本
OLAP 分析工具 - TiSpark
TiSpark 是 PingCAP 为解决用户复杂 OLAP 需求而推出的产品。它借助 Spark 平台,同时融合 TiKV 分布式集群的优势,和 TiDB 一起为用户一站式解决 HTAP (Hybrid Transactional/Analytical Processing) 的需求。