TiDB モニタリングに関するよくある質問
このドキュメントは、TiDB の監視に関連する FAQ をまとめたものです。
- Prometheus 監視フレームワークの詳細については、 監視フレームワークの概要を参照してください。
- モニタリングの主要なメトリックの詳細については、 主な指標を参照してください。
主要な指標を監視するためのより良い方法はありますか?
TiDB の監視システムは、Prometheus と Grafana で構成されています。 Grafana のダッシュボードから、TiDB のさまざまな実行中のメトリックを監視できます。これには、システム リソース、クライアント接続と SQL 操作、内部通信とリージョンスケジューリングの監視メトリックが含まれます。これらのメトリックを使用すると、データベース管理者は、システムの実行ステータス、実行中のボトルネックなどをよりよく理解できます。これらのメトリックを監視する際に、各 TiDBコンポーネントの主要なメトリックをリストします。通常、これらの一般的な指標にのみ注意を払う必要があります。詳細については、 公式文書を参照してください。
Prometheus の監視データは、デフォルトで 15 日ごとに削除されます。 2 か月に設定したり、監視データを手動で削除したりできますか?
はい。 Prometheus が開始されたマシンで起動スクリプトを見つけ、起動パラメーターを編集して、Prometheus を再起動します。
--storage.tsdb.retention="60d"
リージョンヘルス モニター
TiDB 2.0 では、リージョンの正常性は PD メトリック監視ページで監視されます。このページでは、 Region Health監視項目にすべてのリージョンレプリカ ステータスの統計が表示されます。 missレプリカが不足していることを意味し、 extra余分なレプリカが存在することを意味します。また、 Region Health labelによる分離レベルも示しています。 level-1リージョンのレプリカが最初のlabelレベルで物理的に分離されていることを意味します。 location labelが設定されていない場合、すべてのリージョンはlevel-0にあります。
Statement Count モニターでのselectsimplefullの意味は何ですか?
これはフル テーブル スキャンを意味しますが、テーブルは小さなシステム テーブルである可能性があります。
モニターにおけるQPSとStatement OPSの違いは何ですか?
QPS統計はuse database 、 load data 、 begin 、 commit 、 set 、 show 、 insertおよびselectを含むすべての SQL ステートメントに関するものです。
Statement OPS統計は、 select 、 update 、およびinsertを含むアプリケーション関連の SQL ステートメントのみに関するものであるため、 Statement OPS統計はアプリケーションとよりよく一致します。