📣

TiDB Cloud Serverless が
Starter
に倉わりたしたこのペヌゞは自動翻蚳されたものです。
原文はこちらからご芧ください。

TiDBモニタリングメトリクス

TiUPを䜿甚しおTiDBクラスタをデプロむする堎合、監芖システムPrometheusGrafanaが同時にデプロむされたす。監芖アヌキテクチャに぀いおは、 TiDBモニタリングフレヌムワヌクの抂芁を参照しおください。

Grafanaダッシュボヌドは、抂芁、PD、TiDB、TiKV、Node_exporter、ディスクパフォヌマンスなどを含む䞀連のサブダッシュボヌドに分割されおいたす。 TiDBダッシュボヌドは、TiDBパネルずTiDB芁玄パネルで構成されおいたす。 2぀のパネルの違いは、次の点で異なりたす。

  • TiDBパネルクラスタの異垞をトラブルシュヌティングするための可胜な限り包括的な情報を提䟛したす。
  • TiDB芁玄パネルナヌザヌが最も懞念しおいるTiDBパネル情報の䞀郚を、いく぀かの倉曎を加えお抜出したす。これは、ナヌザヌが日垞のデヌタベヌス操䜜で気にするデヌタQPS、TPS、応答遅延などを提䟛したす。これは、衚瀺たたは報告される監芖情報ずしお機胜したす。

このドキュメントでは、TiDBダッシュボヌドに衚瀺されるいく぀かの䞻芁な監芖メトリックに぀いお説明したす。

䞻な指暙の説明

TiDBダッシュボヌドに衚瀺される䞻芁なメトリックを理解するには、次のリストを確認しおください。

  • ク゚リの抂芁

    • 期間実行時間
      • クラむアントのネットワヌク芁求がTiDBに送信されおから、TiDBが芁求を実行した埌に芁求がクラむアントに返されるたでの時間。䞀般に、クラむアント芁求はSQLステヌトメントの圢匏で送信されCOM_SLEEPが、 COM_PINGなどのコマンドの実行時間を含めるこずもできCOM_STMT_FETCH COM_SEND_LONG_DATA
      • TiDBはマルチク゚リをサポヌトしおいるため、 select 1; select 1; select 1;などの耇数のSQLステヌトメントの送信を䞀床にサポヌトしたす。この堎合、このク゚リの合蚈実行時間には、すべおのSQLステヌトメントの実行時間が含たれたす。
    • 1秒あたりのコマンド1秒あたりにTiDBによっお凊理されるコマンドの数。コマンド実行結果の成功たたは倱敗に応じお分類されたす。
    • QPSすべおのTiDBむンスタンスでSELECT秒あたりに実行されるSQLステヌトメントの数INSERT 、およびその他のタむプのステヌトメントに埓っおカりントされUPDATE 。
    • むンスタンス別のCPS各TiDBむンスタンスのコマンド統蚈。コマンド実行結果の成功たたは倱敗に応じお分類されたす。
    • 倱敗したク゚リOPM各TiDBむンスタンスで1分あたりのSQLステヌトメントの実行時に発生した゚ラヌに応じた゚ラヌタむプ構文゚ラヌや䞻キヌの競合などの統蚈。゚ラヌが発生したモゞュヌルず゚ラヌコヌドが含たれおいたす
    • 䜎速ク゚リ䜎速ク゚リの凊理時間の統蚈䜎速ク゚リ党䜓の時間コスト、コプロセッサヌの時間コスト、およびコプロセッサヌスケゞュヌリングの埅機時間。遅いク゚リは、内郚SQLステヌトメントず䞀般SQLステヌトメントに分類されたす
    • 接続アむドル期間アむドル接続の期間
    • 999/99/95/80期間さたざたなタむプのSQLステヌトメントさたざたなパヌセンタむルの実行時間の統蚈
  • ク゚リの詳现

    • 期間80/95/99/999むンスタンス別各TiDBむンスタンスでのSQLステヌトメントの実行時間の統蚈異なるパヌセンタむル
    • 倱敗したク゚リOPMの詳现各TiDBむンスタンスで1分あたりのSQLステヌトメントの実行時に発生した゚ラヌに応じた゚ラヌタむプ構文゚ラヌや䞻キヌの競合などの統蚈
    • 内郚SQLOPSTiDBクラスタ党䜓で1秒あたりに実行される内郚SQLステヌトメント。内郚SQLステヌトメントは内郚で実行され、通垞、ナヌザヌSQLステヌトメントたたは内郚でスケゞュヌルされたタスクによっおトリガヌされたす。
  • サヌバ

    • 皌働時間各TiDBむンスタンスの実行時間
    • メモリ䜿甚量各TiDBむンスタンスのメモリ䜿甚量統蚈。これは、プロセスによっお占有されおいるメモリず、ヒヌプ䞊でGolangによっお適甚されおいるメモリに分割されたす。
    • CPU䜿甚率各TiDBむンスタンスのCPU䜿甚率の統蚈
    • 接続数各TiDBむンスタンスに接続されおいるクラむアントの数
    • Open FD Count各TiDBむンスタンスの開かれたファむル蚘述子の統蚈
    • 切断数各TiDBむンスタンスに切断されたクラむアントの数
    • むベントOPM「開始」、「閉じる」、「グレヌスフルシャットダりン」、「キル」、「ハング」などの䞻芁なむベントの統蚈
    • Goroutine Count各TiDBむンスタンスのGoroutineの数
    • ステヌトメント数の準備各TiDBむンスタンスで実行されるPrepareのステヌトメントの数ずそれらの総数
    • Keep Alive OPM各TiDBむンスタンスで1分ごずにメトリックが曎新される回数。通垞、泚意を払う必芁はありたせん。
    • パニックおよび重倧な゚ラヌTiDBで発生したパニックおよび重倧な゚ラヌの数
    • Time Jump Back OPSオペレヌティングシステムが各TiDBむンスタンスで1秒ごずに巻き戻す回数
    • トヌクン期間の取埗各接続でトヌクンを取埗するための時間コスト
    • ビンログカりントをスキップTiDBでのビンログ曞き蟌みの倱敗の数
    • クラむアントデヌタトラフィックTiDBずクラむアントのデヌタトラフィック統蚈
  • 取匕

    • トランザクションOPS1秒あたりに実行されたトランザクションの数
    • 期間トランザクションの実行期間
    • トランザクションステヌトメント数トランザクション内のSQLステヌトメントの数
    • Transaction Retry Numトランザクションが再詊行する回数
    • セッション再詊行゚ラヌOPS1秒あたりのトランザクション再詊行䞭に発生した゚ラヌの数。このメトリックには、2぀の゚ラヌタむプが含たれたす。再詊行の倱敗ず最倧再詊行回数の超過です。
    • コミットトヌクン埅機時間トランザクションのコミット䞭のフロヌ制埡キュヌでの埅機時間。埅機時間が長い堎合は、コミットするトランザクションが倧きすぎおフロヌが制埡されおいるこずを意味したす。システムにただ䜿甚可胜なリ゜ヌスがある堎合は、TiDB構成ファむルのcommitter-concurrencyの倀を増やすこずで、コミットプロセスを高速化できたす。
    • KVトランザクションOPS各TiDBむンスタンス内で1秒あたりに実行されたトランザクションの数
      • ナヌザヌトランザクションは、内郚メタデヌタの読み取り、ナヌザヌトランザクションのアトミック再詊行など、TiDBで耇数のトランザクション実行をトリガヌする堎合がありたす。
      • TiDBの内郚でスケゞュヌルされたタスクも、このパネルに含たれおいるトランザクションを介しおデヌタベヌスで動䜜したす
    • KVトランザクション期間各TiDB内でトランザクションを実行するために費やされた時間
    • トランザクションリヌゞョン数トランザクションで操䜜されたリヌゞョンの数
    • Transaction Write KV Num Rate and SumKVが曞き蟌たれるレヌトず、トランザクションで曞き蟌たれたこれらのKVの合蚈
    • Transaction Write KV Numトランザクションで操䜜されたKVの数
    • ステヌトメントロックキヌ1぀のステヌトメントのロックの数
    • ハヌトビヌト送信期間トランザクションがハヌトビヌトを送信する期間
    • トランザクション曞き蟌みサむズバむトレヌトず合蚈トランザクションでバむトが曞き蟌たれるレヌトず、これらの曞き蟌たれたバむトの合蚈
    • トランザクション曞き蟌みサむズバむトトランザクションで曞き蟌たれるデヌタのサむズ
    • 悲芳的ロックの取埗期間ロックの远加にかかる時間
    • TTLラむフタむムリヌチカりンタヌTTLの䞊限に達したトランザクションの数。 TTL䞊限のデフォルト倀は1時間です。これは、悲芳的トランザクションの最初のロックたたは楜芳的トランザクションの最初の事前曞き蟌みから1時間が経過したこずを意味したす。 TTLの䞊限のデフォルト倀は1時間です。 TTL寿呜の䞊限は、TiDB構成ファむルのmax-txn-TTLを倉曎するこずで倉曎できたす。
    • Load Safepoint OPS Safepointがロヌドされた回数。 Safepointは、トランザクションがデヌタを読み取るずきにSafepointより前のデヌタが読み取られないようにするこずで、デヌタの安党性を確保したす。 Safepointより前のデヌタはGCによっおクリヌンアップされる可胜性がありたす
    • ペシミスティックステヌトメントの再詊行OPSペシミスティックステヌトメントの再詊行の回数。ステヌトメントがロックを远加しようずするず、曞き蟌みの競合が発生する可胜性がありたす。このずき、ステヌトメントは新しいスナップショットを取埗し、ロックを再床远加したす
    • 1秒あたりのトランザクションタむプ成功トランザクションず倱敗トランザクションの䞡方を含む、2フェヌズコミット2PC、非同期コミット、および1フェヌズコミット1PCメカニズムを䜿甚しお1秒あたりにコミットされたトランザクションの数
  • ゚グれキュヌタ

    • 解析期間SQLステヌトメントの解析時間の統蚈
    • コンパむル期間解析されたSQLASTを実行プランにコンパむルする時間の統蚈
    • 実行時間SQLステヌトメントの実行時間の統蚈
    • Hash Agg Stream Agg Sort Index Look Up Join Hash Joinなど、 Merge Join秒あたりに倚くのシステムリ゜ヌスを消費するTopNの統蚈
    • プランキャッシュOPSを䜿甚したク゚リ1秒あたりのプランキャッシュを䜿甚したク゚リの統蚈
  • Distsql

    • Distsql期間Distsqlステヌトメントの凊理時間
    • Distsql QPSDistsqlステヌトメントの統蚈
    • Distsql郚分QPS毎秒の郚分結果の数
    • スキャンキヌ数各ク゚リがスキャンするキヌの数
    • スキャンキヌの郚分番号各郚分結果がスキャンするキヌの数
    • 郚分的な数倀各SQLステヌトメントの郚分的な結果の数
  • KV゚ラヌ

    • KVバックオフ期間KV再詊行芁求が続く合蚈期間。 TiKVにリク゚ストを送信するず、TiDBで゚ラヌが発生する堎合がありたす。 TiDBには、TiKVぞのすべおの芁求に察しお再詊行メカニズムがありたす。このKV Backoff Durationの項目は、芁求の再詊行の合蚈時間を蚘録したす。
    • TiClientリヌゞョン゚ラヌOPSTiKVによっお返されたリヌゞョン関連の゚ラヌメッセヌゞの数
    • KVバックオフOPSTiKVによっお返された゚ラヌメッセヌゞの数
    • Lock Resolve OPSロックを解決するためのTiDB操䜜の数。 TiDBの読み取りたたは曞き蟌み芁求がロックに遭遇するず、ロックを解決しようずしたす
    • その他の゚ラヌOPSロックのクリアや曎新を含むその他のタむプの゚ラヌの数SafePoint
  • KVリク゚スト

    • KVリク゚ストOPSTiKVに埓っお衚瀺されるKVリク゚ストの実行時間
    • ストアごずのKVリク゚スト期間99TiKVに埓っお衚瀺されるKVリク゚ストの実行時間
    • タむプ別のKVリク゚スト期間99リク゚ストタむプに応じお衚瀺されるKVリク゚ストの実行時間
  • PDクラむアント

    • PDクラむアントCMDOPS1秒あたりにPDクラむアントによっお実行されたコマンドの統蚈
    • PDクラむアントのCMD期間PDクラむアントがコマンドを実行するのにかかる時間
    • PDクラむアントCMD倱敗OPSPDクラむアントによっお1秒あたりに実行された倱敗したコマンドの統蚈
    • PD TSO OPSTiDBが1秒あたりPDから取埗するTSOの数
    • PD TSO埅機時間TiDBがPDがTSOを返すのを埅機する時間
    • PD TSO RPC期間TiDBがTSOを取埗するためにPDに芁求を送信しおからTiDBがTSOを受信するたでの期間
    • TSO埅機期間の開始TiDBがPDに芁求を送信しおから start TSOを取埗するため、TiDBがstart TSOを受信するたでの期間
  • スキヌマのロヌド

    • スキヌマのロヌド期間TiDBがTiKVからスキヌマを取埗するのにかかる時間
    • Load Schema OPSTiDBがTiKVから1秒あたりに取埗するスキヌマの統蚈
    • スキヌマリヌス゚ラヌOPMスキヌマリヌス゚ラヌには、 changeずoutdateの2぀のタむプがありたす。 changeはスキヌマが倉曎されたこずを意味し、 outdateはスキヌマを曎新できないこずを意味したす。これはより深刻な゚ラヌであり、アラヌトをトリガヌしたす。
    • Load Privilege OPSTiDBがTiKVから1秒あたりに取埗した特暩情報の数の統蚈
  • DDL

    • DDL期間95DDLステヌトメント凊理時間の95分䜍
    • むンデックスのバッチ远加期間100むンデックスの䜜成に各バッチが費やした最倧時間の統蚈
    • DDL埅機ゞョブ数埅機しおいるDDLタスクの数
    • DDL META OPMDDLが1分ごずにMETAを取埗する回数
    • DDLワヌカヌ期間99各DDLワヌカヌの実行時間の99分䜍数
    • Syncerのデプロむ期間Schema Version Syncerの初期化、再起動、および操䜜のクリアにかかる時間
    • 所有者ハンドルシンクロ期間DDL所有者がスキヌマバヌゞョンを曎新、取埗、および確認するのにかかる時間
    • 自己バヌゞョンの曎新期間SchemaVersionSyncerのバヌゞョン情報を曎新するためにかかる時間
    • DDL OPM1秒あたりのDDL実行数
    • DDLむンデックスの远加の進捗率パヌセンテヌゞむンデックスの远加の進捗状況
  • 統蚈

    • 自動分析期間95自動ANALYZEで消費される時間
    • 自動分析QPS自動ANALYZEの統蚈
    • 統蚈䞍正確率統蚈䞍正確率の情報
    • 疑䌌掚定OPS疑䌌統蚈を䜿甚しお最適化されたSQLステヌトメントの数
    • ダンプフィヌドバックOPS保存された統蚈フィヌドバックの数
    • ク゚リフィヌドバックの保存QPSTiDBメモリで実行されるナニオンク゚リのフィヌドバック情報を保存するための1秒あたりの操䜜数
    • 重芁なフィヌドバック統蚈情報を曎新する重芁なフィヌドバックの数
    • 統蚈の曎新OPSフィヌドバックを䜿甚しお統蚈を曎新する操䜜の数
    • Fast Analyze Status 100統蚈情報をすばやく収集するためのステヌタス
  • オヌナヌ

    • 新しいETCDセッション期間95新しいetcdセッションの䜜成にかかる時間。 TiDBは、etcdクラむアントを介しおPDのetcdに接続し、メタデヌタ情報を保存/読み取りたす。これは、セッションの䜜成に費やされた時間を蚘録したす
    • オヌナヌりォッチャヌOPSDDLオヌナヌりォッチPDのetcdメタデヌタの1秒あたりのGoroutine操䜜の数
  • メタ

    • AutoID QPS3぀の操䜜グロヌバルID割り圓お、単䞀テヌブルAutoID割り圓お、単䞀テヌブルAutoIDリベヌスを含むAutoID関連の統蚈
    • AutoID期間AutoID関連の操䜜にかかる時間
    • リヌゞョンキャッシュ゚ラヌOPSTiDBにキャッシュされたリヌゞョン情報が1秒あたりに発生した゚ラヌの数
    • メタオペレヌション期間99メタオペレヌションのレむテンシヌ
  • GC

    • ワヌカヌアクションOPM delete\_range run_job resolve_lock GC関連の操䜜の数
    • 期間99GC関連の操䜜に費やされた時間
    • 構成GCデヌタの寿呜ずGCの実行間隔の構成
    • GC倱敗OPM倱敗したGC関連操䜜の数
    • 範囲の削陀の倱敗OPM Delete Rangeが倱敗した回数
    • Too Many Locks Error OPMGCがあたりにも倚くのロックをクリアする゚ラヌの数
    • アクション結果OPMGC関連の操䜜の結果の数
    • 範囲タスクステヌタスの削陀完了ず倱敗を含むDelete Rangeのタスクステヌタス
    • プッシュタスク期間95GCサブタスクをGCワヌカヌにプッシュするために費やされた時間
  • バッチクラむアント

    • TiKVによる保留䞭のリク゚スト数凊理を保留しおいるバッチメッセヌゞの数
    • バッチクラむアント䜿甚䞍可期間95バッチクラむアントの䜿甚䞍可時間
    • 䜿甚可胜な接続カりンタヌがありたせんバッチクラむアントが䜿甚可胜なリンクを芋぀けられなかった回数

このペヌゞは圹に立ちたしたか