📣

TiDB Cloud Serverless 现已更名为
Starter
!此页面由 AI 自动翻译,英文原文请见
此处。

优化器修复控制

随着产品的迭代演进,TiDB 优化器的行为也在不断变化,从而生成更合理的执行计划。但在某些特定场景下,新的行为可能会导致意外的结果。例如:

  • 某些行为的效果依赖于特定场景,对大多数场景带来提升的变更,可能会对其他场景造成回退。
  • 有时,行为细节的变化与其后果之间的关系非常复杂,对某一行为的改进可能会导致整体回退。

因此,TiDB 提供了优化器修复控制功能,允许你通过为一组修复项设置值,对 TiDB 优化器的行为进行细粒度控制。本文档介绍了优化器修复控制功能及其使用方法,并列出了 TiDB 当前支持的所有优化器修复控制项。

tidb_opt_fix_control 简介

自 v6.5.3 和 v7.1.0 起,TiDB 提供了 tidb_opt_fix_control 系统变量,用于以更细粒度的方式控制优化器的行为。

每个修复项都是用于调整 TiDB 优化器某一特定行为的控制项。它以一个数字表示,该数字对应一个包含行为变更技术细节的 GitHub Issue。例如,对于修复项 44262,你可以在 Issue 44262 中查看其控制内容。

tidb_opt_fix_control 系统变量可以同时接受多个修复项,使用逗号(,)分隔。格式为 "<#issue1>:<value1>,<#issue2>:<value2>,...,<#issueN>:<valueN>",其中 <#issueN> 为修复项编号。例如:

SET SESSION tidb_opt_fix_control = '44262:ON,44389:ON';

优化器修复控制项参考

33031 v8.0.0 新增

44262 v6.5.3 和 v7.2.0 新增

44389 v6.5.3 和 v7.2.0 新增

  • 默认值:OFF
  • 可选值:ONOFF
  • 对于如 c = 10 and (a = 'xx' or (a = 'kk' and b = 1)) 这样的过滤条件,该变量控制是否尝试为 IndexRangeScan 构建更全面的扫描范围。

44823 v7.3.0 新增

  • 默认值:200
  • 可选值:[0, 2147483647]
  • 为了节省内存,计划缓存不会缓存参数数量超过该变量指定值的查询。0 表示不限制。

44830 v6.5.7 和 v7.3.0 新增

  • 默认值:OFF
  • 可选值:ONOFF
  • 该变量控制计划缓存是否允许缓存物理优化阶段生成的包含 PointGet 算子的执行计划。

44855 v6.5.4 和 v7.3.0 新增

  • 默认值:OFF
  • 可选值:ONOFF
  • 在某些场景下,当 IndexJoin 算子的 Probe 端包含 Selection 算子时,TiDB 会严重高估 IndexScan 的行数。这可能导致选择了次优的查询计划而不是 IndexJoin
  • 为缓解该问题,TiDB 引入了相关改进。但由于存在查询计划回退的风险,该改进默认关闭。
  • 该变量用于控制是否启用上述改进。

45132 v7.4.0 新增

  • 默认值:1000
  • 可选值:[0, 2147483647]
  • 该变量用于设置优化器启发式选择访问路径的阈值。如果某个访问路径(如 Index_A)的估算行数远小于其他访问路径(默认 1000 倍),优化器会跳过成本比较,直接选择 Index_A
  • 0 表示关闭该启发式策略。

45798 v7.5.0 新增

  • 默认值:ON
  • 可选值:ONOFF
  • 该变量控制计划缓存是否允许缓存访问 生成列 的执行计划。

46177 v6.5.6、v7.1.3 和 v7.5.0 新增

  • 默认值:ON。v8.5.0 之前默认值为 OFF
  • 可选值:ONOFF
  • 该变量控制在查询优化过程中,优化器在找到未强制的计划后,是否继续探索强制计划。

47400 v8.4.0 新增

  • 默认值:ON
  • 可选值:ONOFF
  • 由于难以准确估算查询计划中每一步的合格行数,优化器可能会低估 estRows 的值。该变量用于控制是否限制 estRows 的最小值。
  • ON:将 estRows 的最小值限制为 1,这是 v8.4.0 引入的新行为,并与 Oracle、Db2 等其他数据库保持一致。
  • OFF:不限制最小行数估算,行为与 v8.4.0 之前版本一致,此时 estRows 可能为 0。

52592 v8.4.0 新增

  • 默认值:OFF

  • 可选值:ONOFF

  • 该变量控制是否禁用查询执行中的 Point GetBatch Point Get 算子。默认值 OFF 表示允许使用 Point GetBatch Point Get 执行查询。如果设置为 ON,优化器会禁用 Point GetBatch Point Get,强制选择 Coprocessor 执行查询。

  • Point GetBatch Point Get 不支持列裁剪(即无法只返回部分列),因此在某些场景下,其执行效率可能低于 Coprocessor,将该变量设置为 ON 可以提升查询性能。推荐在以下场景下设置为 ON

    • 宽表,包含大量列,但只查询少量列。
    • 表中包含大体积 JSON 字段,但查询时不涉及该 JSON 字段,或只查询 JSON 字段的一小部分。

52869 v8.1.0 新增

  • 默认值:OFF
  • 可选值:ONOFF
  • Explain Statements Using Index MergeNote 所述,如果优化器能够为查询计划选择单一索引扫描方式(非全表扫描),则不会自动使用索引合并。
  • 你可以通过启用该修复控制项移除此限制。移除该限制后,优化器可以在更多查询中自动选择索引合并,但也可能导致优化器忽略最优的执行计划。因此,建议在实际用例上充分测试,确保不会引发性能回退后再移除该限制。

54337 v8.3.0 新增

  • 默认值:OFF
  • 可选值:ONOFF
  • 目前,TiDB 优化器在推导每个合取项均为区间列表的复杂合取条件的索引范围时存在一定限制。通过应用通用区间交集可以解决该问题。
  • 你可以通过启用该修复控制项移除此限制,使优化器能够处理复杂的区间交集。但对于合取项数量较多(超过 10 个)的条件,优化时间可能会略有增加。

56318

  • 默认值:ON
  • 可选值:ONOFF
  • 该变量控制是否避免在 ORDER BY 语句中对复杂表达式进行两次计算。

文档内容是否有帮助?