Optimizer Fix Controls
随着产品迭代演进,TiDB 优化器的行为会发生变化,进而生成更加合理的执行计划。但在某些特定场景下,新的行为可能会导致非预期结果。例如:
- 部分行为的效果和场景相关。有的行为改变,能在大多数场景下带来改进,但可能在极少数场景下导致回退。
- 有时,行为细节的变化和其导致的结果之间的关系十分复杂。即使是对某处行为细节的改进,也可能在整体上导致执行计划回退。
因此,TiDB 提供了 Optimizer Fix Controls 功能,允许用户通过设置一系列 Fix 控制 TiDB 优化器的行为细节。本文档介绍了 Optimizer Fix Controls 及其使用方法,并列举了当前 TiDB 支持调整的所有 Fix。
tidb_opt_fix_control
介绍
从 TiDB v6.5.3 和 v7.1.0 开始,提供了 tidb_opt_fix_control
系统变量来更细粒度地控制优化器的行为。
一个 Fix 是用于调整 TiDB 优化器中一处行为的控制项。它以一个数字编号表示,该数字编号对应一个 GitHub Issue,在 Issue 中会有对技术细节的描述。例如 Fix 44262
对应 Issue 44262。
tidb_opt_fix_control
支持设置多个 Fix,不同 Fix 之间使用逗号 (,
) 分隔。格式形如 "<#issue1>:<value1>,<#issue2>:<value2>,...,<#issueN>:<valueN>"
,其中 <#issueN>
代表 Fix 编号。例如:
SET SESSION tidb_opt_fix_control = '44262:ON,44389:ON';
Optimizer Fix Controls 参考
33031
从 v8.0.0 版本开始引入
- 默认值:
OFF
- 可选值:
ON
、OFF
- 是否允许对分区表进行计划缓存。如果设置为
ON
,则 Prepared 语句计划缓存和非 Prepared 语句计划缓存都不会对分区表启用。
44262
从 v6.5.3 和 v7.2.0 版本开始引入
44389
从 v6.5.3 和 v7.2.0 版本开始引入
- 默认值:
OFF
- 可选值:
ON
、OFF
- 对形如
c = 10 and (a = 'xx' or (a = 'kk' and b = 1))
的过滤条件,是否尝试为IndexRangeScan
更加完整地构造扫描范围,即range
。
44823
从 v7.3.0 版本开始引入
- 默认值:
200
- 可选值:
[0, 2147483647]
- 为了节省内存,对于参数个数超过此开关指定个数的查询,Plan Cache 将不会缓存。
0
表示无限制。
44830
从 v6.5.7 和 v7.3.0 版本开始引入
- 默认值:
OFF
- 可选值:
ON
、OFF
- 此开关控制是否让 Plan Cache 对在物理优化阶段形成的
PointGet
计划进行缓存。
44855
从 v6.5.4 和 v7.3.0 版本开始引入
- 默认值:
OFF
- 可选值:
ON
、OFF
- 在某些场景下,当
IndexJoin
算子的Probe
端包含Selection
算子时,TiDB 会严重高估IndexScan
的行数,导致在IndexJoin
更好的时候选择了其它的执行计划。 - TiDB 已经引入了缓解这类问题的改进逻辑。但是由于潜在的计划回退风险,该改进并没有被默认启用。
- 此开关控制是否启用这个改进。
45132
从 v7.4.0 版本开始引入
- 默认值:
1000
- 可选值:
[0, 2147483647]
- 此开关控制优化器进行启发式访问路径选择的阈值。当某个访问路径(如
Index_A
)的估算行数远小于其他访问路径时(默认为1000
倍),优化器会跳过代价比较直接选择Index_A
。 0
表示关闭此启发式访问路径选择策略。
45798
从 v7.5.0 版本开始引入
- 默认值:
ON
- 可选值:
ON
、OFF
- 此开关控制是否允许 Plan Cache 缓存访问生成列的执行计划。
46177
从 v6.5.6、v7.1.3 和 v7.5.0 版本开始引入
- 默认值:
ON
。在 v8.5.0 之前,默认值为OFF
。 - 可选值:
ON
、OFF
- 此开关控制优化器在查询优化的过程中,找到非强制执行计划后,是否继续查找强制执行计划进行查询优化。
47400
从 v8.4.0 版本开始引入
- 默认值:
ON
- 可选值:
ON
、OFF
- 由于查询计划中每个步骤符合条件的行数难以精确估算,优化器有可能会为
estRows
估算出一个较小的值。此开关控制是否限制estRows
的最小值。 ON
:将estRows
的最小值限制为 1。这是 v8.4.0 中引入的新行为,与 Oracle 和 DB2 等数据库一致。OFF
:不限制estRows
的最小值,与 v8.4.0 之前版本的行为保持一致。此时,estRows
可能为 0。
52592
从 v8.4.0 版本开始引入
默认值:
OFF
可选值:
ON
、OFF
此开关控制是否禁用
Point Get
和Batch Point Get
算子执行查询。默认值OFF
代表允许通过Point Get
和Batch Point Get
执行查询。如果设置为ON
,优化器会禁用Point Get
和Batch Point Get
,强制选择 Coprocessor 执行查询。Point Get
和Batch Point Get
不支持列投影(即无法只返回部分列的数据),这意味着在某些场景中其执行效率可能低于 Coprocessor,此时设置为ON
可以提高查询性能。以下是推荐设置为ON
的场景:- 查询具有多列的宽表,且仅涉及表中的少量列。
- 查询包含大型 JSON 值的表,且不需要检索整个 JSON 列,或仅需提取 JSON 列中的小部分数据。
52869
从 v8.1.0 版本开始引入
- 默认值:
OFF
- 可选值:
ON
、OFF
- 如果查询有除了全表扫描以外的单索引扫描方式可以选择,优化器不会自动选择索引合并。详情请参考用 EXPLAIN 查看索引合并的 SQL 执行计划中的注意部分。
- 打开此开关后,这个限制会被解除。解除此限制能让优化器在更多查询中自动选择索引合并,但也有可能忽略其他更好的执行计划,因此建议在解除此限制前针对实际场景进行充分测试,确保不会带来性能回退。
54337
从 v8.2.0 版本开始引入
- 默认值:
OFF
- 可选值:
ON
、OFF
- 目前,TiDB 优化器在处理每个子句包含范围列表的复杂连接条件时,推导索引范围存在一定限制。此问题可以通过应用通用范围交集来解决。
- 打开此开关后,这个限制会被解除。解除此限制能让优化器处理复杂范围交集。然而,对于子句数量较多(超过 10 个)的条件,可能会有略微增加优化时间的风险。