TiDB Lightning 目标数据库要求

使用 TiDB Lightning 导入数据前，先检查环境是否满足要求，这有助于减少导入过程的错误，避免导入失败的情况。

目标数据库权限要求

TiDB Lightning 导入数据时，根据导入方式和启用特性等，需要下游数据库用户具备不同的权限，可参考下表：

	特性	作用域	所需权限	备注
必需	基本功能	目标 table	CREATE,SELECT,INSERT,UPDATE,DELETE,DROP,ALTER	DROP 仅 tidb-lightning-ctl 在执行 checkpoint-destroy-all 时需要
必需	基本功能	目标 database	CREATE
必需	逻辑导入模式	information_schema.columns	SELECT
	物理导入模式	mysql.tidb	SELECT
		-	SUPER
		-	RESTRICTED_VARIABLES_ADMIN,RESTRICTED_TABLES_ADMIN	当目标 TiDB 开启 SEM
推荐	冲突检测，max-error	lightning.task-info-schema-name 配置的 schema	SELECT,INSERT,UPDATE,DELETE,CREATE,DROP	如不需要，该值必须设为""
可选	并行导入	lightning.meta-schema-name 配置的 schema	SELECT,INSERT,UPDATE,DELETE,CREATE,DROP	如不需要，该值必须设为""
可选	checkpoint.driver = "mysql"	checkpoint.schema 设置	SELECT,INSERT,UPDATE,DELETE,CREATE,DROP	使用数据库而非文件形式存放 checkpoint 信息时需要

目标数据库所需空间

目标 TiKV 集群必须有足够空间接收新导入的数据。除了标准硬件配置以外，目标 TiKV 集群的总存储空间必须大于 数据源大小 × 副本数量 × 2。例如集群默认使用 3 副本，那么总存储空间需为数据源大小的 6 倍以上。公式中的 2 倍可能难以理解，其依据是以下因素的估算空间占用：

索引会占据额外的空间
RocksDB 的空间放大效应

目前无法精确计算 Dumpling 从 MySQL 导出的数据大小，但你可以用下面 SQL 语句统计信息表的 DATA_LENGTH 字段估算数据量：

统计所有 schema 大小，单位 MiB，注意修改 ${schema_name}

-- 统计所有 schema 大小
SELECT
  TABLE_SCHEMA,
  FORMAT_BYTES(SUM(DATA_LENGTH)) AS 'Data Size',
  FORMAT_BYTES(SUM(INDEX_LENGTH)) 'Index Size'
FROM
  information_schema.tables
GROUP BY
  TABLE_SCHEMA;

-- 统计最大的 5 个单表
SELECT
  TABLE_NAME,
  TABLE_SCHEMA,
  FORMAT_BYTES(SUM(data_length)) AS 'Data Size',
  FORMAT_BYTES(SUM(index_length)) AS 'Index Size',
  FORMAT_BYTES(SUM(data_length+index_length)) AS 'Total Size'
FROM
  information_schema.tables
GROUP BY
  TABLE_NAME,
  TABLE_SCHEMA
ORDER BY
  SUM(DATA_LENGTH+INDEX_LENGTH) DESC
LIMIT
  5;

TiDB Lightning 目标数据库要求

目标数据库权限要求

目标数据库所需空间

文档内容是否有帮助？