TiDB Cloud組み込みアラート
TiDB Cloud を使用すると、アラートの表示、アラート ルールの編集、アラート通知のサブスクライブを簡単に行うことができます。
このドキュメントでは、これらの操作を実行する方法について説明し、参考としてTiDB Cloudに組み込まれているアラート条件を示します。
注記:
現在、アラート機能はTiDB Cloud専用クラスターでのみ使用できます。
アラートをビュー
TiDB Cloudでは、アラートページでアクティブなアラートと閉じられたアラートの両方を表示できます。
TiDB Cloudコンソールで、プロジェクトのクラスターページに移動します。
ヒント:
左上隅のコンボ ボックスを使用して、組織、プロジェクト、クラスターを切り替えることができます。
対象クラスターの名前をクリックします。クラスターの概要ページが表示されます。
左側のナビゲーション ペインで[アラート]をクリックします。
アラートページには、デフォルトでアクティブなアラートが表示されます。アラート名、発生時刻、期間など、各アラートの情報を確認できます。
完了したアラートも表示したい場合は、 [ステータス]ドロップダウン リストをクリックし、 [完了]または[すべて]を選択します。
アラートルールを編集する
TiDB Cloudでは、アラートを無効化または有効化したり、アラートしきい値を更新したりすることで、アラート ルールを編集できます。
[アラート]ページで、 [ルールの編集] をクリックします。
必要に応じてアラート ルールを無効または有効にします。
アラート ルールのしきい値を更新するには、 [編集]をクリックします。
ヒント:
現在、 TiDB Cloudアラートルールの編集機能が制限されています。一部のアラートルールは編集をサポートしていません。異なるトリガー条件や頻度を設定したい場合、またはページャーデューティような下流サービスでアラートによって自動的にアクションがトリガーされるようにしたい場合は、 サードパーティの監視とアラートの統合のご利用をご検討ください。
アラート通知を購読する
TiDB Cloudでは、次のいずれかの方法でアラート通知をサブスクライブできます。
TiDB Cloud組み込みアラート条件
次の表は、TiDB Cloudの組み込みアラート条件とそれに対応する推奨アクションを示しています。
注記:
- これらのアラート状態は必ずしも問題があることを意味するものではありませんが、新たな問題の早期警告となる場合が多くあります。したがって、推奨される措置を講じることをお勧めします。
- TiDB Cloudコンソールでアラートのしきい値を編集できます。
- 一部のアラートルールはデフォルトで無効になっています。必要に応じて有効にすることができます。
リソース使用状況アラート
状態 | 推奨されるアクション |
---|---|
クラスタ全体の TiDB ノードのメモリ使用率が 10 分間で 70% を超えました | 現在のワークロードのメモリ使用量の割合を減らすには、TiDB のノード数またはノード サイズを増やすことを検討してください。 |
クラスタ全体の TiKV ノードのメモリ使用率が 10 分間で 70% を超えました | 現在のワークロードのメモリ使用量の割合を減らすには、TiKV のノード数またはノード サイズを増やすことを検討してください。 |
クラスタ全体のTiFlashノードメモリ使用率が 10 分間で 70% を超えました | 現在のワークロードのメモリ使用量の割合を減らすには、 TiFlashのノード数またはノード サイズを増やすことを検討してください。 |
TiDBノードのCPU使用率が10分間80%を超えました | 現在のワークロードの CPU 使用率を下げるには、TiDB のノード数またはノード サイズを増やすことを検討してください。 |
TiKVノードのCPU使用率が10分間80%を超えました | 現在のワークロードの CPU 使用率を下げるには、TiKV のノード数またはノード サイズを増やすことを検討してください。 |
TiFlashノードのCPU使用率が10分間80%を超えました | 現在のワークロードの CPU 使用率を下げるには、 TiFlashのノード数またはノード サイズを増やすことを検討してください。 |
TiKVstorageの使用率が80%を超える | storage容量を増やすには、TiKV のノード数またはノードstorageサイズを増やすことを検討してください。 |
TiFlashstorageの使用率が80%を超える | storage容量を増やすには、 TiFlashのノード数またはノードstorageサイズを増やすことを検討してください。 |
TiDB ノード全体の最大メモリ使用率が 10 分間 70% を超えました | 現在のワークロードのメモリ使用率を下げるには、クラスター内にホットスポットあるかどうかを確認するか、TiDB のノード数またはノード サイズを増やすことを検討してください。 |
TiKVノード全体の最大メモリ使用率が10分間70%を超えました | 現在のワークロードのメモリ使用率を下げるには、クラスター内にホットスポットあるかどうかを確認するか、TiKV のノード数またはノード サイズを増やすことを検討してください。 |
TiDBノード全体の最大CPU使用率が10分間80%を超えました | 現在のワークロードの CPU 使用率を下げるには、クラスター内にホットスポットあるかどうかを確認するか、TiDB のノード数またはノード サイズを増やすことを検討してください。 |
TiKVノード全体の最大CPU使用率が10分間80%を超えました | 現在のワークロードの CPU 使用率を下げるには、クラスター内にホットスポットあるかどうかを確認するか、TiKV のノード数またはノード サイズを増やすことを検討してください。 |
データ移行アラート
状態 | 推奨されるアクション |
---|---|
データ移行ジョブでデータのエクスポート中にエラーが発生しました | エラーを確認し、ヘルプについてはデータ移行のトラブルシューティング参照してください。 |
データ移行ジョブでデータのインポート中にエラーが発生しました | エラーを確認し、ヘルプについてはデータ移行のトラブルシューティング参照してください。 |
増分移行中にデータ移行ジョブでエラーが発生しました | エラーを確認し、ヘルプについてはデータ移行のトラブルシューティング参照してください。 |
増分移行中にデータ移行ジョブが 6 時間以上一時停止されました | データ移行ジョブは、データ増分移行中に6時間以上一時停止されています。上流データベースのbinlogがパージされている可能性があり(データベースのbinlogパージ戦略によって異なります)、増分移行が失敗する可能性があります。ヘルプについてはデータ移行のトラブルシューティング参照してください。 |
レプリケーション遅延は10分を超えており、20分以上増加し続けています | ヘルプについてはデータ移行のトラブルシューティング参照してください。 |
チェンジフィードアラート
状態 | 推奨されるアクション |
---|---|
変更フィードのレイテンシーが 600 秒を超えています。 | TiDB CloudコンソールのChangefeedページとChangefeed の詳細ページで changefeed のステータスを確認してください。そこには、この問題の診断に役立ついくつかのエラー メッセージがあります。 このアラートをトリガーする可能性のある理由は次のとおりです:
|
changefeed ステータスはFAILED です。 | TiDB CloudコンソールのChangefeedページとChangefeed の詳細ページで changefeed のステータスを確認してください。そこには、この問題の診断に役立ついくつかのエラー メッセージがあります。 お客様側で問題を解決できない場合は、 TiDB Cloudサポート連絡してさらにサポートを受けることができます。 |
changefeed ステータスはWARNING です。 | TiDB CloudコンソールのChangefeedページとChangefeed の詳細ページで changefeed のステータスを確認してください。そこには、この問題の診断に役立ついくつかのエラー メッセージがあります。 お客様側で問題を解決できない場合は、 TiDB Cloudサポート連絡してさらにサポートを受けることができます。 |