KDDIクラウドプラットフォームサービス ナレッジサイト

  • HOME
  • サービス
  • 共通サービス
  • フォーメーション
  • 仮想サーバー(インスタンス)作成
  • 監視設定(KDDI推奨監視)
  • OS基本監視

OS基本監視

KDDI推奨監視のOS基本監視の概要は以下になります。
※監視内容の詳細については、こちらをご確認ください。

1.死活監視(Linux,Windows共通)

  • 1.1 監視対象

Linux,WindowsそれぞれのOSがインストールされた仮想サーバー

 

  • 1.2 監視設定内容

monitoringnetwork経由で、mackerel-agent→mackerelサーバへ1分ごとに情報を送信します。
Mackerelサーバで約10分間情報の送信が確認できない場合にアラートが発生します。

 

2.リソース監視(Linux,Windows共通)

  • 2.1 監視対象

mackerel-agent インストール時に指定しているロールを監視対象とします。

 

ロール名:KCPSManagedOption:kcps

 

新規仮想サーバーの作成と同時に監視設定をする場合は、上記のロールの中に仮想サーバーが登録されます。
新規仮想サーバー以外の既存の仮想サーバーも上記ロールに所属させることで、OS基本監視を追加することが可能になります。
※事前にMackerelエージェントをインストールしておく必要があります。

 

  • 2.2 監視項目および監視設定内容
・2.2.1 CPU
設定項目名 設定値 概要
監視対象 監視対象のメトリック CPU% 監視対象のホストメトリック名
監視対象の絞り込み KCPSManagedOption:kcps 監視設定が登録されるロール名/サービス名
アラートの発生条件 Warningの条件 70 warningのAlert発生の閾値
Criticalの条件 70 criticalのAlert発生の閾値
条件の持続時間 5 設定した間隔(分)の平均値を監視
基本設定 監視ルール名 CPU% (KCPS) Mackerel管理画面に表示される監視名

 

・2.2.2 メモリー
設定項目名 設定値 概要
監視対象 監視対象のメトリック Memory% 監視対象のホストメトリック名
監視対象の絞込 KCPSManagedOption:kcps 監視設定が登録されるロール名/サービス名
アラートの発生条件 Warningの条件 70 warningのAlert発生の閾値
Criticalの条件 70 criticalのAlert発生の閾値
条件の持続時間 5 設定した間隔(分)の平均値を監視
基本設定 監視ルール名 Memory% (KCPS) Mackerel管理画面に表示される監視名

 

・2.2.3 ディスク容量
設定項目名 設定値 概要
監視対象 監視対象のメトリック Filesystem% 監視対象のホストメトリック名
監視対象の絞込 KCPSManagedOption:kcps 監視設定が登録されるロール名/サービス名
アラートの発生条件 Warningの条件 90 warningのAlert発生の閾値
Criticalの条件 90 criticalのAlert発生の閾値
条件の持続時間 3 設定した間隔(分)の平均値を監視
基本設定 監視ルール名 DISK% (KCPS) Mackerel管理画面に表示される監視名

 

3.イベントログ監視(Windowsの場合)

  • 3.1 監視対象

Windows系OSがインストールされている仮想サーバー

 

  • 3.2 監視設定内容
設定項目 設定値 概要
プラグイン名 plugin.checks.kcps_eventlog ログ監視を実現するプラグインの名称
イベントタイプ Error 検知するログの種類
Mackerelへの送信 有効 検知した内容をMackerelへ送信

※1分ごとに監視状態をチェックします。前回のチェック以降にアラートが発生しなかった場合は、アラートがクローズされます。

例1. アラート発生後、アラート発生条件を満たすログが出力されなかった場合
【事象】:アラート発生→次の監視状態チェックまでに、アラート発生条件を満たすログが出力されない
【結果】:アラートはクローズされます

例2. アラート発生後、アラート発生条件を満たすログが出力された場合
【事象】:アラート発生→次の監視状態チェックまでに、アラート発生条件を満たすログが出力された
【結果】:アラートが継続します

例3. アラートクローズ後、再度アラートが発生した場合
【事象】:アラート(1)発生→監視状態チェックまでに、アラート発生条件を満たすログが出力されない→再度アラート(2)発生
【結果】:アラート(1)はクローズされ、別アラートとしてアラート(2)が発生します

 

4.ログ監視(Linuxの場合)

  • 4.1 監視対象

Linux系OSがインストールされている仮想サーバー

 

  • 4.2 監視設定内容
設定項目 設定値 概要
プラグイン名 plugin.checks.kcps_log_messages ログ監視を実現するプラグインの名称
監視ファイル /var/log/messages 監視するファイルのパス
検知文言 warning|error|emerg|alert|critical 検知する文言

※1分ごとに監視状態をチェックします。前回のチェック以降にアラートが発生しなかった場合は、アラートがクローズされます。
※検知文言がアラート発生途中で変わってもアラートが継続している場合は、同一アラートとして処理されます。

例1. アラート発生後、アラート発生条件を満たすログが出力されなかった場合

【事象】:アラート発生→次の監視状態チェックまでに、アラート発生条件を満たすログが出力されない
【結果】:アラートはクローズされます

例2. アラート発生後、アラート発生条件を満たすログが出力された場合
【事象】:アラート発生→次の監視状態チェックまでに、アラート発生条件を満たすログが出力された
【結果】:アラートが継続します

例3. アラートクローズ後、再度アラートが発生した場合
【事象】:アラート(1)発生→監視状態チェックまでに、アラート発生条件を満たすログが出力されない→再度アラート(2)発生
【結果】:アラート(1)はクローズされ、別アラートとしてアラート(2)が発生します

 

サービス

2024/03/15 2024/03/15