Optimizer Fix Controls

随着产品迭代演进,TiDB 优化器的行为会发生变化,进而生成更加合理的执行计划。但在某些特定场景下,新的行为可能会导致非预期结果。例如:

  • 部分行为的效果和场景相关。有的行为改变,能在大多数场景下带来改进,但可能在极少数场景下导致回退。
  • 有时,行为细节的变化和其导致的结果之间的关系十分复杂。即使是对某处行为细节的改进,也可能在整体上导致执行计划回退。

因此,TiDB 提供了 Optimizer Fix Controls 功能,允许用户通过设置一系列 Fix 控制 TiDB 优化器的行为细节。本文档介绍了 Optimizer Fix Controls 及其使用方法,并列举了当前 TiDB 支持调整的所有 Fix。

tidb_opt_fix_control 介绍

从 TiDB v6.5.3 和 v7.1.0 开始,提供了 tidb_opt_fix_control 系统变量来更细粒度地控制优化器的行为。

一个 Fix 是用于调整 TiDB 优化器中一处行为的控制项。它以一个数字编号表示,该数字编号对应一个 GitHub Issue,在 Issue 中会有对技术细节的描述。例如 Fix 44262 对应 Issue 44262

tidb_opt_fix_control 支持设置多个 Fix,不同 Fix 之间使用逗号 (,) 分隔。格式形如 "<#issue1>:<value1>,<#issue2>:<value2>,...,<#issueN>:<valueN>",其中 <#issueN> 代表 Fix 编号。例如:

SET SESSION tidb_opt_fix_control = '44262:ON,44389:ON';

Optimizer Fix Controls 参考

33031 从 v8.0.0 版本开始引入

44262 从 v6.5.3 和 v7.2.0 版本开始引入

44389 从 v6.5.3 和 v7.2.0 版本开始引入

  • 默认值:OFF
  • 可选值:ONOFF
  • 对形如 c = 10 and (a = 'xx' or (a = 'kk' and b = 1)) 的过滤条件,是否尝试为 IndexRangeScan 更加完整地构造扫描范围,即 range

44823 从 v7.3.0 版本开始引入

  • 默认值:200
  • 可选值:[0, 2147483647]
  • 为了节省内存,对于参数个数超过此开关指定个数的查询,Plan Cache 将不会缓存。0 表示无限制。

44830 从 v6.5.7 和 v7.3.0 版本开始引入

  • 默认值:OFF
  • 可选值:ONOFF
  • 此开关控制是否让 Plan Cache 对在物理优化阶段形成的 PointGet 计划进行缓存。

44855 从 v6.5.4 和 v7.3.0 版本开始引入

  • 默认值:OFF
  • 可选值:ONOFF
  • 在某些场景下,当 IndexJoin 算子的 Probe 端包含 Selection 算子时,TiDB 会严重高估 IndexScan 的行数,导致在 IndexJoin 更好的时候选择了其它的执行计划。
  • TiDB 已经引入了缓解这类问题的改进逻辑。但是由于潜在的计划回退风险,该改进并没有被默认启用。
  • 此开关控制是否启用这个改进。

45132 从 v7.4.0 版本开始引入

  • 默认值:1000
  • 可选值:[0, 2147483647]
  • 此开关控制优化器进行启发式访问路径选择的阈值。当某个访问路径(如 Index_A)的估算行数远小于其他访问路径时(默认为 1000 倍),优化器会跳过代价比较直接选择 Index_A
  • 0 表示关闭此启发式访问路径选择策略。

47400 从 v8.4.0 版本开始引入

  • 默认值:ON
  • 可选值:ONOFF
  • 由于查询计划中每个步骤符合条件的行数难以精确估算,优化器有可能会为 estRows 估算出一个较小的值。此开关控制是否限制 estRows 的最小值。
  • ON:将 estRows 的最小值限制为 1。这是 v8.4.0 中引入的新行为,与 Oracle 和 DB2 等数据库一致。
  • OFF:不限制 estRows 的最小值,与 v8.4.0 之前版本的行为保持一致。此时,estRows 可能为 0。

52592 从 v8.4.0 版本开始引入

  • 默认值:OFF

  • 可选值:ONOFF

  • 此开关控制是否禁用 Point GetBatch Point Get 算子执行查询。默认值 OFF 代表允许通过 Point GetBatch Point Get 执行查询。如果设置为 ON,优化器会禁用 Point GetBatch Point Get,强制选择 Coprocessor 执行查询。

  • Point GetBatch Point Get 不支持列投影(即无法只返回部分列的数据),这意味着在某些场景中其执行效率可能低于 Coprocessor,此时设置为 ON 可以提高查询性能。以下是推荐设置为 ON 的场景:

    • 查询具有多列的宽表,且仅涉及表中的少量列。
    • 查询包含大型 JSON 值的表,且不需要检索整个 JSON 列,或仅需提取 JSON 列中的小部分数据。

52869 从 v8.1.0 版本开始引入

  • 默认值:OFF
  • 可选值:ONOFF
  • 如果查询有除了全表扫描以外的单索引扫描方式可以选择,优化器不会自动选择索引合并。详情请参考用 EXPLAIN 查看索引合并的 SQL 执行计划中的注意部分。
  • 打开此开关后,这个限制会被解除。解除此限制能让优化器在更多查询中自动选择索引合并,但也有可能忽略其他更好的执行计划,因此建议在解除此限制前针对实际场景进行充分测试,确保不会带来性能回退。

文档内容是否有帮助?