TiDB Cloudの組み込みアラート機能
TiDB Cloud を使用すると、アラートの表示、アラートルールの編集、アラート通知の購読を簡単に行うことができます。
このドキュメントでは、これらの操作を実行する方法について説明し、参考としてTiDB Cloudに組み込まれているアラート条件を示します。
注記:
現在、アラート購読はTiDB Cloud EssentialインスタンスおよびTiDB Cloud Dedicatedクラスタで利用可能です。
アラートをビュー
TiDB Cloudでは、アラートページでアクティブなアラートとクローズされたアラートの両方を表示できます。
TiDB Cloudコンソールで、私のTiDBページに移動します。
ヒント:
複数の組織に所属している場合は、左上隅のコンボボックスを使用して、まず目的の組織に切り替えてください。
対象のTiDB Cloud EssentialインスタンスまたはTiDB Cloud Dedicatedクラスタの名前をクリックすると、その概要ページに移動します。
左側のナビゲーションペインにある「アラート」をクリックします。
アラートページには、デフォルトで有効なアラートが表示されます。各アラートについて、アラート名、トリガー時刻、期間などの情報を確認できます。
解決済みの警告も表示したい場合は、ステータスのドロップダウンリストをクリックして、 「解決済み」または「すべて」を選択してください。
アラートルールを編集する
TiDB Cloudでは、アラートを無効化または有効化したり、アラートのしきい値を更新したりすることで、アラートルールを編集できます。
アラートページで、 [ルールの編集]をクリックします。
必要に応じてアラートルールを無効化または有効化してください。
アラートルールのしきい値を更新するには、 「編集」をクリックします。
ヒント:
現在、 TiDB Cloudでは、アラート ルール編集の機能が制限されています。一部のアラート ルールは編集をサポートしていません。異なるトリガー条件や頻度を構成したい場合、またはPagerDutyなどのダウンストリーム サービスでアラートが自動的にアクションをトリガーするサードパーティの監視およびアラートとの統合使用を検討してください。
アラート通知を購読する
TiDB Cloudでは、以下のいずれかの方法でアラート通知を購読できます。
TiDB Cloudに組み込まれたアラート条件
以下の表は、TiDB Cloudに組み込まれているアラート条件と、それに対応する推奨アクションを示しています。
注記:
- これらの警戒状態は必ずしも問題が発生していることを意味するものではありませんが、多くの場合、新たな問題が発生する兆候を示しています。したがって、推奨される対策を講じることをお勧めします。
- TiDB Cloudコンソールでアラートのしきい値を編集できます。
- 一部のアラートルールはデフォルトで無効になっています。必要に応じて有効にすることができます。
TiDB Cloudは、そのプランで利用可能特徴に基づいて、 TiDB Cloudプランごとに異なるアラート ルールを提供します。
リソース使用状況アラート
| 状態 | 推奨される行動 |
|---|
| クラスター全体のTiDBノードのメモリ使用率が10分間70%を超えました。 | 現在のワークロードにおけるメモリ使用率を削減するために、TiDBのノード数またはノードサイズを増やすことを検討してください。 |
| TiKVクラスター全体のノードメモリ使用率が10分間70%を超えました。 | 現在のワークロードにおけるメモリ使用率を削減するために、TiKVのノード数またはノードサイズを増やすことを検討してください。 |
| クラスター全体のTiFlashノードのメモリ使用率が10分間70%を超えました。 | 現在のワークロードにおけるメモリ使用率を低減するために、 TiFlashのノード数またはノードサイズを増やすことを検討してください。 |
| TiDBノード全体のCPU使用率が10分間80%を超えました。 | 現在のワークロードにおけるCPU使用率を低減するために、TiDBのノード数またはノードサイズを増やすことを検討してください。 |
| TiKVノード全体のCPU使用率が10分間80%を超えました。 | 現在のワークロードにおけるCPU使用率を低減するために、TiKVのノード数またはノードサイズを増やすことを検討してください。 |
| TiFlashノード全体のCPU使用率が10分間80%を超えました。 | 現在のワークロードにおけるCPU使用率を低減するために、 TiFlashのノード数またはノードサイズを増やすことを検討してください。 |
| TiKVstorageの利用率は80%を超えました。 | storage容量を増やすには、TiKVのノード数またはノードのstorageサイズを増やすことを検討してください。TiKVのstorage使用率が80%を超えると、レイテンシーの急上昇が発生する可能性があり、使用率が高くなるとリクエストが失敗する場合があります。 |
| TiFlashstorageの利用率は80%を超えています。 | TiFlashのstorage容量を増やすには、ノード数またはノードのstorageサイズを増やすことを検討してください。すべてのTiFlashノードのstorage使用率が80%に達すると、 TiFlashレプリカを追加するDDLステートメントは永久にハングアップします。 |
| TiDBノード全体の最大メモリ使用率が10分間70%を超えました。 | クラスター内にホットスポットがないか確認するか、TiDBのノード数またはノードサイズを増やして、現在のワークロードのメモリ使用率を削減することを検討してください。 |
| TiKVノード全体の最大メモリ使用率が10分間70%を超えました。 | クラスター内にホットスポットがないか確認するか、TiKVのノード数またはノードサイズを増やして、現在のワークロードのメモリ使用率を削減することを検討してください。 |
| TiDBノード全体のCPU使用率が10分間80%を超えました。 | クラスター内にホットスポットがないか確認するか、TiDBのノード数またはノードサイズを増やして、現在のワークロードのCPU使用率を下げることを検討してください。 |
| TiKVノード全体のCPU使用率が10分間80%を超えました。 | クラスター内にホットスポットがないか確認するか、TiKVのノード数またはノードサイズを増やして、現在のワークロードのCPU使用率を下げることを検討してください。 |
データ移行に関する警告
| 状態 | 推奨される行動 |
|---|
| データ移行ジョブでデータエクスポート中にエラーが発生しました | エラーを確認し、ヘルプについてはデータ移行のトラブルシューティング参照してください。 |
| データ移行ジョブのデータインポート中にエラーが発生しました | エラーを確認し、ヘルプについてはデータ移行のトラブルシューティング参照してください。 |
| データ移行ジョブで増分移行中にエラーが発生しました | エラーを確認し、ヘルプについてはデータ移行のトラブルシューティング参照してください。 |
| データ移行ジョブが増分移行中に6時間以上一時停止しています | データの増分移行中に、データ移行ジョブが 6 時間以上一時停止されました。アップストリーム データベースのbinlogがパージされる可能性があり (データベースのbinlogパージ戦略によって異なります)、増分移行が失敗する可能性があります。ヘルプについてはデータ移行のトラブルシューティング参照してください。 |
| レプリケーション遅延は10分を超え、20分以上経過しても増加し続けている。 | ヘルプについてはデータ移行のトラブルシューティング参照してください。 |
TiDB Cloud Dedicatedの変更フィードアラート
| 状態 | 推奨される行動 |
|---|
| 変更フィードのレイテンシーが600秒を超えています。 | TiDB Cloudコンソールの「変更フィード」ページと「変更フィード詳細」ページで変更フィードのステータスを確認してください。これらのページには、この問題の診断に役立つエラーメッセージがいくつか表示されています。 このアラートが発生する可能性のある理由としては、以下のようなものが挙げられます。- アップストリーム全体のトラフィックが増加したため、既存のチェンジフィード仕様では対応しきれなくなりました。トラフィックの増加が一時的なものであれば、トラフィックが正常に戻ればチェンジフィードのレイテンシーは自動的に回復します。トラフィックの増加が継続する場合は、チェンジフィードをスケールアップする必要があります。
- 下流側またはネットワークに異常が発生しています。この場合は、まずこの異常を解消してください。
- ダウンストリームがRDSの場合、テーブルにインデックスが不足しているため、書き込みパフォーマンスの低下やレイテンシーの増加が発生する可能性があります。この場合、アップストリームまたはダウンストリームに必要なインデックスを追加する必要があります。
お客様側で問題を解決できない場合は、 TiDB Cloudサポートにお問い合わせください。 |
変更フィードの状態はFAILEDです。 | TiDB Cloudコンソールの「変更フィード」ページと「変更フィード詳細」ページで変更フィードのステータスを確認してください。これらのページには、この問題の診断に役立つエラーメッセージがいくつか表示されています。 お客様側で問題を解決できない場合は、 TiDB Cloudサポートにお問い合わせください。 |
変更フィードの状態はWARNINGです。 | TiDB Cloudコンソールの「変更フィード」ページと「変更フィード詳細」ページで変更フィードのステータスを確認してください。これらのページには、この問題の診断に役立つエラーメッセージがいくつか表示されています。 お客様側で問題を解決できない場合は、 TiDB Cloudサポートにお問い合わせください。 |