集成 TiDB Cloud 与 Prometheus 和 Grafana
TiDB Cloud 提供了一个 Prometheus API 端点。如果你拥有 Prometheus 服务,可以轻松地通过该端点监控 TiDB Cloud 的关键统计/指标(信息)。
本文档介绍了如何配置你的 Prometheus 服务,从 TiDB Cloud 端点读取关键统计/指标(信息),以及如何使用 Grafana 查看这些统计/指标(信息)。
Prometheus 集成版本
自 2022 年 3 月 15 日起,TiDB Cloud 支持项目级 Prometheus 集成(Beta)。自 2025 年 10 月 21 日起,TiDB Cloud 推出集群级 Prometheus 集成(预览版)。自 2025 年 12 月 2 日起,集群级 Prometheus 集成正式可用(GA)。
集群级 Prometheus 集成:如果在 2025 年 10 月 21 日前,你的组织内没有未删除的遗留项目级 Prometheus 集成,TiDB Cloud 将为你的组织提供集群级 Prometheus 集成,以体验最新增强功能。
遗留项目级 Prometheus 集成(Beta):如果在 2025 年 10 月 21 日前,你的组织内至少有一个未删除的遗留项目级 Prometheus 集成,TiDB Cloud 会在项目级别保留现有和新建的集成,以避免影响当前的仪表盘。
前提条件
若要集成 TiDB Cloud 与 Prometheus,你必须拥有自托管或托管的 Prometheus 服务。
若要为 TiDB Cloud 设置第三方统计/指标(信息)集成,你必须在 TiDB Cloud 中拥有
Organization Owner或Project Owner访问权限。若要查看集成页面,至少需要Project Viewer角色以访问项目下的目标集群。
限制
- Prometheus 和 Grafana 集成目前仅适用于 TiDB Cloud Dedicated 集群。
- 当集群状态为 CREATING、RESTORING、PAUSED 或 RESUMING 时,不支持 Prometheus 和 Grafana 集成。
步骤
步骤 1. 获取 Prometheus 的 scrape_config 文件
在配置 Prometheus 服务以读取 TiDB Cloud 统计/指标(信息)之前,你需要先在 TiDB Cloud 中生成一个 scrape_config YAML 文件。该 scrape_config 文件包含一个唯一的 bearer token,允许 Prometheus 服务监控你的目标集群。
根据你的 Prometheus 集成版本,获取 Prometheus 的 scrape_config 文件及访问集成页面的步骤有所不同。
- 在 TiDB Cloud 控制台中,导航到你的项目的 Clusters 页面,然后点击目标集群名称进入其概览页面。
- 在左侧导航栏,点击 Settings > Integrations。
- 在 Integrations 页面,点击 Integration to Prometheus。
- 点击 Add File,为当前集群生成并显示
scrape_config文件。 - 复制
scrape_config文件内容,供后续使用。
- 在 TiDB Cloud 控制台中,使用左上角的下拉框切换到目标项目。
- 在左侧导航栏,点击 Project Settings > Integrations。
- 在 Integrations 页面,点击 Integration to Prometheus (BETA)。
- 点击 Add File,为当前项目生成并显示 scrape_config 文件。
- 复制 scrape_config 文件内容,供后续使用。
步骤 2. 集成 Prometheus
在你的 Prometheus 服务指定的监控目录中,找到 Prometheus 配置文件。
例如:
/etc/prometheus/prometheus.yml。在 Prometheus 配置文件中,找到
scrape_configs部分,然后将从 TiDB Cloud 获取的scrape_config文件内容复制到该部分。在 Prometheus 服务中,检查 Status > Targets,确认新的
scrape_config文件已被读取。如果未生效,可能需要重启 Prometheus 服务。
步骤 3. 使用 Grafana GUI 仪表盘可视化统计/指标(信息)
当你的 Prometheus 服务已从 TiDB Cloud 读取统计/指标(信息)后,可以通过 Grafana GUI 仪表盘进行可视化,操作如下:
根据你的 Prometheus 集成版本,下载 TiDB Cloud for Prometheus 的 Grafana 仪表盘 JSON 文件的链接不同。
将该 JSON 导入到你自己的 Grafana GUI,以可视化统计/指标(信息)。
(可选)根据需要自定义仪表盘,例如添加或移除面板、修改数据源、调整显示选项等。
关于如何使用 Grafana 的更多信息,请参见 Grafana 官方文档。
scrape_config 轮转最佳实践
为提升数据安全性,建议定期轮转 scrape_config 文件的 bearer token。
- 按照 步骤 1 为 Prometheus 创建新的
scrape_config文件。 - 将新文件内容添加到 Prometheus 配置文件中。
- 确认 Prometheus 服务仍能从 TiDB Cloud 读取后,从 Prometheus 配置文件中移除旧的
scrape_config文件内容。 - 在项目或集群的 Integrations 页面,删除对应的旧
scrape_config文件,防止他人利用其读取 TiDB Cloud Prometheus 端点。
Prometheus 可用统计/指标(信息)
Prometheus 会跟踪你的 TiDB 集群的以下统计/指标(信息)数据。
对于集群级 Prometheus 集成,还可获取以下额外统计/指标(信息):
常见问题
为什么同一统计/指标(信息)在 Grafana 和 TiDB Cloud 控制台上同时显示的数值不同?
Grafana 与 TiDB Cloud 的聚合计算逻辑不同,因此显示的聚合值可能存在差异。你可以在 Grafana 中调整
mini step配置,以获得更细粒度的统计/指标(信息)值。