TiDB Dashboard 概况页面
该页面显示了整个集群的概况,包含以下信息:
- 整个集群的 QPS
- 整个集群的查询延迟
- 最近一段时间内累计耗时最多的若干 SQL 语句
- 最近一段时间内运行时间超过一定阈值的慢查询
- 各个实例的节点数和状态
- 监控及告警信息
访问
登录 TiDB Dashboard 后默认进入该页面,也可以左侧导航条点击概况 (Overview) 进入:
QPS
该区域显示最近一小时整个集群的每秒成功和失败查询数量:
延迟
该区域显示最近一小时整个集群中 99.9%、99% 和 90% 查询的延迟:
Top SQL 语句
该区域显示最近一段时间内整个群集中累计耗时最长的 10 类 SQL 语句。查询参数不一样但结构一样的 SQL 会归为同一类 SQL 语句,在同一行中显示:
该区域显示的内容与 SQL 语句分析页面一致,可点击 Top SQL 语句 (Top SQL Statements) 标题查看完整列表。关于该表格中各列详情,见 SQL 语句分析页面。
最近的慢查询
该区域默认显示最近 30 分钟内整个集群中最新的 10 条慢查询:
默认情况下运行时间超过 300ms 的 SQL 查询即会被计为慢查询并显示在该表格中。可通过调整 tidb_slow_log_threshold 变量或 TiDB instance.tidb_slow_log_threshold 参数调整阈值。
该区域显示的内容与慢查询页面一致,可点击最近的慢查询 (Recent Slow Queries) 标题查看完整列表。关于该表格中各列详情,见慢查询页面。
实例
该区域汇总显示了整个集群中 TiDB、TiKV、PD、TiFlash 的总实例数量及异常实例数量:
状态描述如下:
- Up:实例运行正常(含下线中的存储实例)。
- Down:实例运行异常,例如网络无法连接、进程已崩溃等。
点击实例标题可进入集群信息页面查看各个实例的详细运行状态。
监控和告警
该区域提供了便捷的链接方便用户查看详细监控或告警:
- 查看监控链接:点击后跳转至 Grafana 页面,可查看集群详细监控信息。关于 Grafana 监控面板中各个详细监控指标的解释,参见监控指标文档。
- 查看告警链接:点击后跳转至 AlertManager 页面,可查看集群详细告警信息。当集群中已有告警时,告警数量将会直接显示在链接文本上。
- 运行诊断链接:点击后跳转至集群诊断页面,参见集群诊断页面了解详情。