- 关于 TiDB
- 主要概念
- 操作指南
- 快速上手
- 部署
- 配置
- 安全
- 安全传输层协议 (TLS)
- 生成自签名证书
- 监控
- 迁移
- 运维
- 扩容缩容
- 升级
- 故障诊断
- 参考手册
- SQL
- 与 MySQL 兼容性对比
- SQL 语言结构
- 数据类型
- 函数与操作符
- SQL 语句
ADD COLUMN
ADD INDEX
ADMIN
ADMIN CANCEL DDL
ADMIN CHECKSUM TABLE
ADMIN CHECK [TABLE|INDEX]
ADMIN SHOW DDL [JOBS|QUERIES]
ALTER DATABASE
ALTER TABLE
ALTER USER
ANALYZE TABLE
BEGIN
CHANGE COLUMN
COMMIT
CREATE DATABASE
CREATE INDEX
CREATE TABLE LIKE
CREATE TABLE
CREATE USER
DEALLOCATE
DELETE
DESC
DESCRIBE
DO
DROP COLUMN
DROP DATABASE
DROP INDEX
DROP TABLE
DROP USER
EXECUTE
EXPLAIN ANALYZE
EXPLAIN
FLUSH PRIVILEGES
FLUSH STATUS
FLUSH TABLES
GRANT <privileges>
INSERT
KILL [TIDB]
LOAD DATA
LOAD STATS
MODIFY COLUMN
PREPARE
RENAME INDEX
RENAME TABLE
REPLACE
REVOKE <privileges>
ROLLBACK
SELECT
SET [NAMES|CHARACTER SET]
SET PASSWORD
SET TRANSACTION
SET [GLOBAL|SESSION] <variable>
SHOW CHARACTER SET
SHOW COLLATION
SHOW [FULL] COLUMNS FROM
SHOW CREATE TABLE
SHOW DATABASES
SHOW ENGINES
SHOW ERRORS
SHOW [FULL] FIELDS FROM
SHOW GRANTS
SHOW INDEXES [FROM|IN]
SHOW INDEX [FROM|IN]
SHOW KEYS [FROM|IN]
SHOW PRIVILEGES
SHOW [FULL] PROCESSSLIST
SHOW SCHEMAS
SHOW STATUS
SHOW [FULL] TABLES
SHOW TABLE STATUS
SHOW [GLOBAL|SESSION] VARIABLES
SHOW WARNINGS
START TRANSACTION
TRACE
TRUNCATE
UPDATE
USE
- 约束
- 生成列
- 字符集
- 配置
- tidb-server
- pd-server
- tikv-server
- 安全
- 事务
- 系统数据库
- 错误码
- 支持的连接器和 API
- 垃圾回收 (GC)
- 性能调优
- 监控指标
- 报警规则
- 最佳实践
- TiSpark 使用指南
- TiDB Binlog
- 周边工具
- 常见问题 (FAQ)
- 技术支持
- 贡献
- 版本发布历史
- 术语表
重要
你正在查看 TiDB 数据库的较旧版本 (TiDB v2.1) 的文档。
如无特殊需求,建议使用 TiDB 数据库的最新 LTS 版本。
TiDB 2.0 Release Notes
2018 年 4 月 27 日,TiDB 发布 2.0 GA 版。相比 1.0 版本,该版本对 MySQL 兼容性、系统稳定性、优化器和执行器做了很多改进。
TiDB
- SQL 优化器
- 精简统计信息数据结构,减小内存占用
- 加快进程启动时加载统计信息速度
- 支持统计信息动态更新 [experimental]
- 优化代价模型,对代价估算更精准
- 使用
Count-Min Sketch
更精确地估算点查的代价 - 支持分析更复杂的条件,尽可能充分的使用索引
- 支持通过
STRAIGHT_JOIN
语法手动指定 Join 顺序 GROUP BY
子句为空时使用 Stream Aggregation 算子,提升性能- 支持使用索引计算
Max/Min
函数 - 优化关联子查询处理算法,支持将更多类型的关联子查询解关联并转化成
Left Outer Join
- 扩大
IndexLookupJoin
的使用范围,索引前缀匹配的场景也可以使用该算法
- SQL 执行引擎
- 使用 Chunk 结构重构所有执行器算子,提升分析型语句执行性能,减少内存占用,显著提升 TPC-H 结果
- 支持 Streaming Aggregation 算子下推
- 优化
Insert Into Ignore
语句性能,提升 10 倍以上 - 优化
Insert On Duplicate Key Update
语句性能,提升 10 倍以上 - 下推更多的数据类型和函数到 TiKV 计算
- 优化
Load Data
性能,提升 10 倍以上 - 支持对物理算子内存使用进行统计,通过配置文件以及系统变量指定超过阈值后的处理行为
- 支持限制单条 SQL 语句使用内存的大小,减少程序 OOM 风险
- 支持在 CRUD 操作中使用隐式的行 ID
- 提升点查性能
- Server
- 支持 Proxy Protocol
- 添加大量监控项, 优化日志
- 支持配置文件的合法性检测
- 支持 HTTP API 获取 TiDB 参数信息
- 使用 Batch 方式 Resolve Lock,提升垃圾回收速度
- 支持多线程垃圾回收
- 支持 TLS
- 兼容性
- 支持更多 MySQL 语法
- 支持配置文件修改
lower_case_table_names
系统变量,用于支持 OGG 数据同步工具 - 提升对 Navicat 的兼容性
- 在
Information_Schema
中支持显示建表时间 - 修复部分函数/表达式返回类型和 MySQL 不同的问题
- 提升对 JDBC 兼容性
- 支持更多的
SQL_MODE
- DDL
- 优化
Add Index
的执行速度,部分场景下速度大幅度提升 Add Index
操作变更为低优先级,降低对线上业务影响Admin Show DDL Jobs
输出更详细的 DDL 任务状态信息- 支持
Admin Show DDL Job Queries JobID
查询当前正在运行的 DDL 任务的原始语句 - 支持
Admin Recover Index
命令,用于灾难恢复情况下修复索引数据 - 支持通过
Alter
语句修改 Table Options
- 优化
PD
- 增加
Region Merge
支持,合并数据删除后产生的空 Region [experimental] - 增加
Raft Learner
支持 [experimental] - 调度器优化
- 调度器适应不同的 Region size
- 提升 TiKV 宕机时数据恢复的优先级和恢复速度
- 提升下线 TiKV 节点搬迁数据的速度
- 优化 TiKV 节点空间不足时的调度策略,尽可能防止空间不足时磁盘被写满
- 提升 balance-leader scheduler 的调度效率
- 减少 balance-region scheduler 调度开销
- 优化 hot-region scheduler 的执行效率
- 运维接口及配置
- 增加 TLS 支持
- 支持设置 PD leader 优先级
- 支持基于 label 配置属性
- 支持配置特定 label 的节点不调度 Region leader
- 支持手动 Split Region,可用于处理单 Region 热点的问题
- 支持打散指定 Region,用于某些情况下手动调整热点 Region 分布
- 增加配置参数检查规则,完善配置项的合法性较验
- 调试接口
- 增加
Drop Region
调试接口 - 增加枚举各个 PD health 状态的接口
- 增加
- 统计相关
- 添加异常 Region 的统计
- 添加 Region 隔离级别的统计
- 添加调度相关 metrics
- 性能优化
- PD leader 尽量与 etcd leader 保持同步,提升写入性能
- 优化 Region heartbeat 性能,现可支持超过 100 万 Region
TiKV
- 功能
- 保护关键配置,防止错误修改
- 支持
Region Merge
[experimental] - 添加
Raw DeleteRange
API - 添加
GetMetric
API - 添加
Raw Batch Put
,Raw Batch Get
,Raw Batch Delete
和Raw Batch Scan
- 给 Raw KV API 增加 Column Family 参数,能对特定 Column Family 进行操作
- Coprocessor 支持 streaming 模式,支持 streaming 聚合
- 支持配置 Coprocessor 请求的超时时间
- 心跳包携带时间戳
- 支持在线修改 RocksDB 的一些参数,包括
block-cache-size
大小等 - 支持配置 Coprocessor 遇到某些错误时的行为
- 支持以导数据模式启动,减少导数据过程中的写放大
- 支持手动对 region 进行对半 split
- 完善数据修复工具 tikv-ctl
- Coprocessor 返回更多的统计信息,以便指导 TiDB 的行为
- 支持 ImportSST API,可以用于 SST 文件导入 [experimental]
- 新增 TiKV Importer 二进制,与 TiDB Lightning 集成用于快速导入数据 [experimental]
- 性能
- 使用 ReadPool 优化读性能,
raw_get/get/batch_get
提升 30% - 提升 metrics 的性能
- Raft snapshot 处理完之后立即通知 PD,加快调度速度
- 解决 RocksDB 刷盘导致性能抖动问题
- 提升在数据删除之后的空间回收
- 加速启动过程中的垃圾清理过程
- 使用
DeleteFilesInRanges
减少副本迁移时 I/O 开销
- 使用 ReadPool 优化读性能,
- 稳定性
- 解决在 PD leader 发送切换的情况下 gRPC call 不返回问题
- 解决由于 snapshot 导致下线节点慢的问题
- 限制搬移副本临时占用的空间大小
- 如果有 Region 长时间没有 Leader,进行上报
- 根据 compaction 事件及时更新统计的 Region size
- 限制单次 scan lock 请求的扫描的数据量,防止超时
- 限制接收 snapshot 过程中的内存占用,防止 OOM
- 提升 CI test 的速度
- 解决由于 snapshot 太多导致的 OOM 问题
- 配置 gRPC 的
keepalive
参数 - 修复 Region 增多容易 OOM 的问题
TiSpark
TiSpark 使用独立的版本号,现为 1.0 GA。TiSpark 1.0 版本组件提供了针对 TiDB 上的数据使用 Apache Spark 进行分布式计算的能力。
- 提供了针对 TiKV 读取的 gRPC 通信框架
- 提供了对 TiKV 组件数据的和通信协议部分的编码解码
- 提供了计算下推功能,包含:
- 聚合下推
- 谓词下推
- TopN 下推
- Limit 下推
- 提供了索引相关的支持
- 谓词转化聚簇索引范围
- 谓词转化次级索引
- Index Only 查询优化
- 运行时索引退化扫表优化
- 提供了基于代价的优化
- 统计信息支持
- 索引选择
- 广播表代价估算
- 多种 Spark Interface 的支持
- Spark Shell 支持
- ThriftServer/JDBC 支持
- Spark-SQL 交互支持
- PySpark Shell 支持
- SparkR 支持
文档内容是否有帮助?