📣
TiDB Cloud Essential はパブリックプレビュー中です。このページは自動翻訳されたものです。原文はこちらからご覧ください。

TiDBデータ移行におけるアラートの処理

このドキュメントでは、DM でアラート情報を処理する方法について説明します。

DM_master_all_down

  • 説明:

    すべての DM マスター ノードがオフラインの場合、このアラートがトリガーされます。

  • 解決:

    アラートを処理するには、次の手順を実行できます。

    1. クラスターの環境を確認します。
    2. トラブルシューティングのために、すべての DM マスター ノードのログを確認してください。

DM_worker_offline

  • 説明:

    DMワーカーノードが1時間以上オフラインの場合、このアラートがトリガーされます。高可用性アーキテクチャでは、このアラートによってタスクが直接中断されることはないかもしれませんが、中断のリスクが高まります。

  • 解決:

    アラートを処理するには、次の手順を実行できます。

    1. 対応する DM ワーカー ノードの動作ステータスをビュー。
    2. ノードが接続されているかどうかを確認します。
    3. ログを通じてエラーをトラブルシューティングします。

DM_DDL_error

  • 説明:

    このエラーは、DM がシャーディング DDL 操作を処理しているときに発生します。

  • 解決:

    DMのトラブルシューティングを参照してください。

DM_pending_DDL

  • 説明:

    シャーディング DDL 操作が 1 時間以上保留されている場合、このアラートがトリガーされます。

  • 解決:

    シナリオによっては、保留中のシャーディングDDL操作がユーザーの期待どおりになる場合があります。それ以外の場合は、解決策についてはDM でシャーディング DDL ロックを手動で処理するを参照してください。

DM_task_state

  • 説明:

    DM ワーカーのサブタスクが 20 分以上Paused状態にある場合、アラートがトリガーされます。

  • 解決:

    DMのトラブルシューティングを参照してください。

DM_relay_process_exits_with_error

  • 説明:

    リレー ログ処理ユニットで自動回復不可能なエラー (例: binlogファイルが見つからない) が発生した場合、または短時間に回復可能なエラー (例: ネットワークの問題) が複数発生した場合 (例: 2 分間に 3 回以上)、このアラートがトリガーされます。

  • 解決:

    DMのトラブルシューティングを参照してください。

DM_remain_storage_of_relay_log

  • 説明:

    リレーログが保存されているディスクの空き容量が 10G 未満になると、アラートがトリガーされます。

  • 解決策:

    アラートを処理するには、次の方法があります。

    • 不要なデータを手動で削除して、空きディスク容量を増やします。
    • リレーログの自動データ消去戦略またはデータを手動で消去するを再構成します。
    • コマンドpause-relayを実行して、リレーログのプルプロセスを一時停止します。十分なディスク空き容量が確保できたら、コマンドresume-relayを実行してプロセスを再開します。リレーログのプルプロセスを一時停止した後、プルされていないアップストリームのbinlogファイルを削除しないでください。

DM_relay_log_data_corruption

  • 説明:

    リレーログ処理ユニットが上流から読み取ったbinlogイベントを検証し、異常なチェックサム情報を検出すると、このユニットはPaused状態に移行し、アラートがトリガーされます。

  • 解決:

    DMのトラブルシューティングを参照してください。

DM_fail_to_read_binlog_from_master

  • 説明:

    リレーログ処理ユニットが上流からbinlogイベントを読み取ろうとしたときにエラーが発生した場合、このユニットはPaused状態に移行し、アラートがトリガーされます。

  • 解決:

    DMのトラブルシューティングを参照してください。

DM_fail_to_write_relay_log

  • 説明:

    リレー ログ処理ユニットがbinlogイベントをリレー ログ ファイルに書き込むときにエラーが発生すると、このユニットはPaused状態に移行し、アラートがトリガーされます。

  • 解決:

    DMのトラブルシューティングを参照してください。

DM_binlog_file_gap_between_master_relay

  • 説明:

    現在のアップストリーム MySQL/MariaDB のbinlogファイルの数が、リレー ログ処理ユニットによってプルされた最新のbinlogファイルの数を 10 分間で 1以上超過すると、アラートがトリガーされます。

  • 解決:

    DMのトラブルシューティングを参照してください。

DM_dump_process_exists_with_error

  • 説明:

    ダンプ処理ユニットで自動回復不可能なエラー (例: binlogファイルが見つからない) が発生した場合、または短時間に (例: 2 分間に 3 回以上) 回復可能なエラー (例: ネットワークの問題) が複数発生した場合、このアラートがトリガーされます。

  • 解決:

    DMのトラブルシューティングを参照してください。

DM_load_process_exists_with_error

  • 説明:

    ロード処理ユニットで自動回復不可能なエラー (例: binlogファイルが見つからない) が発生した場合、または短時間に (例: 2 分間に 3 回以上) 回復可能なエラー (例: ネットワークの問題) が複数発生した場合、このアラートがトリガーされます。

  • 解決:

    DMのトラブルシューティングを参照してください。

DM_sync_process_exists_with_error

  • 説明:

    binlogレプリケーション処理ユニットで自動回復不可能なエラー (binlogファイルが見つからないなど) が発生した場合、または短時間 (2 分間に 3 回以上など) に複数の回復可能なエラー (ネットワークの問題など) が発生した場合、このアラートがトリガーされます。

  • 解決:

    DMのトラブルシューティングを参照してください。

DM_binlog_file_gap_between_master_syncer

  • 説明:

    現在のアップストリーム MySQL/MariaDB のbinlogファイルの数が、リレー ログ処理装置で処理された最新のbinlogファイルの数を 10 分間で 1以上超えると、アラートがトリガーされます。

  • 解決:

    パフォーマンスの問題に対処するを参照してください。

DM_binlog_file_gap_between_relay_syncer

  • 説明:

    現在のリレーログ処理単位内のbinlogファイルの数が、binlogログレプリケーション処理単位で処理された最新のbinlogファイルの数より 10 分間に 1以上超過すると、アラートがトリガーされます。

  • 解決:

    パフォーマンスの問題に対処するを参照してください。

このページは役に立ちましたか?