重要

你正在查看 TiDB v8.4 (DMR) 的文档。PingCAP 不提供基于 v8.4 的 bug 修复版本，如有 bug，会在后续版本中修复。如无特殊需求，建议使用 TiDB 数据库的最新 LTS 版本。

Schema 缓存

在一些多租户的场景下，可能会存在几十万甚至上百万个数据库和表。这些数据库和表的 schema 信息如果全部加载到内存中，一方面会占用大量的内存，另一方面会导致相关的访问性能变差。为了解决这个问题，TiDB 引入了类似于 LRU 的 schema 缓存机制。只将最近用到的数据库和表的 schema 信息缓存到内存中。

警告

该功能目前为实验特性，不建议在生产环境中使用。该功能可能会在未事先通知的情况下发生变化或删除。如果发现 bug，请在 GitHub 上提 issue 反馈。

配置 schema 缓存

可以通过配置系统变量 tidb_schema_cache_size 来打开 schema 缓存特性。

最佳实践

在大量数据库和表的场景下（例如 10 万以上的数据库和表数量）或者当数据库和表的数量大到影响系统性能时，建议打开 schema 缓存特性。
可以通过观测 TiDB 监控中 Schema load 下的子面板 Infoschema v2 Cache Operation 来查看 schema 缓存的命中率。如果命中率较低，可以调大 tidb_schema_cache_size。
可以通过观测 TiDB 监控中 Schema load 下的子面板 Infoschema v2 Cache Size 来查看当前使用的 schema 缓存的大小。
建议关闭 performance.force-init-stats 以减少 TiDB 的启动时间。
如果需要创建大量的表（例如 10 万张以上），建议将参数 split-table 设置为 false 以减少 Region 数量，从而降低 TiKV 的内存。

已知限制

在大量数据库和表的场景下，有以下已知问题：

当对表的访问没有规律，如 time1 访问一批表，time2 访问另外一批表，而且设置的 tidb_schema_cache_size 较小时，会导致这些 schema 信息被频繁地被逐出，频繁地被缓存，造成性能抖动。该特性比较适合被频繁访问的库和表是相对固定的场景。
统计信息不一定能够及时收集。
一些元数据信息的访问会变慢。
切换 schema 缓存开关需要等待一段时间。
全量列举所有元数据信息的相关操作会变慢，如：
- SHOW FULL TABLES
- FLASHBACK
- ALTER TABLE ... SET TIFLASH MODE ...
对于设置了 AUTO_INCREMENT 或 AUTO_RANDOM 属性的表，如果 schema 缓存设置过小，这些表的元信息可能会在内存中被频繁地缓存和淘汰。这种频繁的缓存变动可能导致未使用完的 ID 段失效，从而引发 ID 跳变。在写入量较大的场景下，甚至可能导致 ID 段耗尽。为减少此类问题并提升系统稳定性，建议采取以下措施：
- 通过监控面板查看 schema 缓存的命中率和大小，以评估缓存设置是否合理。并适当调大 schema 缓存大小，以减少频繁的缓存淘汰。
- 将 AUTO_ID_CACHE 设置为 1，以防止 ID 跳变。
- 合理设置 AUTO_RANDOM 的分片位和保留位，避免可分配 ID 范围过小。

Schema 缓存

配置 schema 缓存

最佳实践

已知限制

文档内容是否有帮助？