TiDB Cloud 内置告警
s
O
q
TiDB Cloud 为你提供了一种简单的方式来查看告警、编辑告警规则和订阅告警通知。
本文介绍如何执行这些操作,并提供 TiDB Cloud 内置告警条件供你参考。
查看告警
在 TiDB Cloud 中,你可以在告警页面查看活动和已关闭的告警。
在 TiDB Cloud 控制台中,导航到项目的集群页面。
提示:
你可以使用左上角的组合框在组织、项目和集群之间切换。
点击目标集群的名称。此时会显示集群概览页面。
在左侧导航栏中点击告警。
告警页面默认显示活动告警。你可以查看每个活动告警的信息,如告警名称、触发时间和持续时间。
如果你也想查看已关闭的告警,只需点击状态下拉列表并选择已关闭或全部。
编辑告警规则
在 TiDB Cloud 中,你可以通过禁用或启用告警或更新告警阈值来编辑告警规则。
在告警页面,点击编辑规则。
根据需要禁用或启用告警规则。
点击编辑来更新告警规则的阈值。
提示:
目前,TiDB Cloud 提供有限的告警规则编辑功能。某些告警规则不支持编辑。如果你想配置不同的触发条件或频率,或让告警自动触发下游服务(如 PagerDuty)中的操作,请考虑使用第三方监控和告警集成。
订阅告警通知
在 TiDB Cloud 中,你可以通过以下方法之一订阅告警通知:
TiDB Cloud 内置告警条件
下表提供了 TiDB Cloud 内置告警条件和相应的建议操作。
资源使用告警
条件 | 建议操作 |
---|---|
集群中 TiDB 节点的总内存使用率超过 70% 持续 10 分钟 | 考虑增加 TiDB 的节点数量或节点大小,以减少当前工作负载的内存使用百分比。 |
集群中 TiKV 节点的总内存使用率超过 70% 持续 10 分钟 | 考虑增加 TiKV 的节点数量或节点大小,以减少当前工作负载的内存使用百分比。 |
集群中 TiFlash 节点的总内存使用率超过 70% 持续 10 分钟 | 考虑增加 TiFlash 的节点数量或节点大小,以减少当前工作负载的内存使用百分比。 |
TiDB 节点的总 CPU 使用率超过 80% 持续 10 分钟 | 考虑增加 TiDB 的节点数量或节点大小,以减少当前工作负载的 CPU 使用百分比。 |
TiKV 节点的总 CPU 使用率超过 80% 持续 10 分钟 | 考虑增加 TiKV 的节点数量或节点大小,以减少当前工作负载的 CPU 使用百分比。 |
TiFlash 节点的总 CPU 使用率超过 80% 持续 10 分钟 | 考虑增加 TiFlash 的节点数量或节点大小,以减少当前工作负载的 CPU 使用百分比。 |
TiKV 存储使用率超过 80% | 考虑增加 TiKV 的节点数量或节点存储大小以增加存储容量。 |
TiFlash 存储使用率超过 80% | 考虑增加 TiFlash 的节点数量或节点存储大小以增加存储容量。 |
TiDB 节点中的最大内存使用率超过 70% 持续 10 分钟 | 考虑检查集群中是否存在任何热点问题,或增加 TiDB 的节点数量或节点大小,以减少当前工作负载的内存使用百分比。 |
TiKV 节点中的最大内存使用率超过 70% 持续 10 分钟 | 考虑检查集群中是否存在任何热点问题,或增加 TiKV 的节点数量或节点大小,以减少当前工作负载的内存使用百分比。 |
TiDB 节点中的最大 CPU 使用率超过 80% 持续 10 分钟 | 考虑检查集群中是否存在任何热点问题,或增加 TiDB 的节点数量或节点大小,以减少当前工作负载的 CPU 使用百分比。 |
TiKV 节点中的最大 CPU 使用率超过 80% 持续 10 分钟 | 考虑检查集群中是否存在任何热点问题,或增加 TiKV 的节点数量或节点大小,以减少当前工作负载的 CPU 使用百分比。 |
数据迁移告警
条件 | 建议操作 |
---|---|
数据导出期间数据迁移任务遇到错误 | 检查错误并参阅故障排除数据迁移获取帮助。 |
数据导入期间数据迁移任务遇到错误 | 检查错误并参阅故障排除数据迁移获取帮助。 |
增量迁移期间数据迁移任务遇到错误 | 检查错误并参阅故障排除数据迁移获取帮助。 |
增量迁移期间数据迁移任务已暂停超过 6 小时 | 数据增量迁移期间数据迁移任务已暂停超过 6 小时。上游数据库中的 binlog 可能已被清除(取决于你的数据库 binlog 清除策略)并可能导致增量迁移失败。参阅故障排除数据迁移获取帮助。 |
复制延迟大于 10 分钟且持续增加超过 20 分钟 | 参阅故障排除数据迁移获取帮助。 |
Changefeed 告警
条件 | 建议操作 |
---|---|
Changefeed 延迟超过 600 秒。 | 在 TiDB Cloud 控制台的 Changefeed 页面和 Changefeed 详情页面上检查 changefeed 状态,你可以在那里找到一些错误消息来帮助诊断此问题。 可能触发此告警的原因包括:
|
Changefeed 状态为 FAILED 。 | 在 TiDB Cloud 控制台的 Changefeed 页面和 Changefeed 详情页面上检查 changefeed 状态,你可以在那里找到一些错误消息来帮助诊断此问题。 如果问题无法从你这边解决,你可以联系 TiDB Cloud 支持团队寻求进一步帮助。 |
Changefeed 状态为 WARNING 。 | 在 TiDB Cloud 控制台的 Changefeed 页面和 Changefeed 详情页面上检查 changefeed 状态,你可以在那里找到一些错误消息来帮助诊断此问题。 如果问题无法从你这边解决,你可以联系 TiDB Cloud 支持团队寻求进一步帮助。 |
TiDB Cloud 内置告警更新于 7/9/2025, 6:29:57 AM: release-8.5: sync the cloud docs to the latest version (#21355)