- HOME
- サービス
- 共通サービス
- フォーメーション
- 仮想サーバー(インスタンス)作成
- 監視設定(KDDI推奨監視)
- OS基本監視
OS基本監視
KDDI推奨監視のOS基本監視の概要は以下になります。
※監視内容の詳細については、こちらをご確認ください。
1.死活監視(Linux,Windows共通)
- 1.1 監視対象
Linux,WindowsそれぞれのOSがインストールされた仮想サーバー
- 1.2 監視設定内容
monitoringnetwork経由で、mackerel-agent→mackerelサーバへ1分ごとに情報を送信します。
Mackerelサーバで約10分間情報の送信が確認できない場合にアラートが発生します。
2.リソース監視(Linux,Windows共通)
- 2.1 監視対象
mackerel-agent インストール時に指定しているロールを監視対象とします。
ロール名:KCPSManagedOption:kcps
新規仮想サーバーの作成と同時に監視設定をする場合は、上記のロールの中に仮想サーバーが登録されます。
新規仮想サーバー以外の既存の仮想サーバーも上記ロールに所属させることで、OS基本監視を追加することが可能になります。
※事前にMackerelエージェントをインストールしておく必要があります。
- 2.2 監視項目および監視設定内容
・2.2.1 CPU
設定項目名 | 設定値 | 概要 | |
---|---|---|---|
監視対象 | 監視対象のメトリック | CPU% | 監視対象のホストメトリック名 |
監視対象の絞り込み | KCPSManagedOption:kcps | 監視設定が登録されるロール名/サービス名 | |
アラートの発生条件 | Warningの条件 | 70 | warningのAlert発生の閾値 |
Criticalの条件 | 70 | criticalのAlert発生の閾値 | |
条件の持続時間 | 5 | 設定した間隔(分)の平均値を監視 | |
基本設定 | 監視ルール名 | CPU% (KCPS) | Mackerel管理画面に表示される監視名 |
・2.2.2 メモリー
設定項目名 | 設定値 | 概要 | |
---|---|---|---|
監視対象 | 監視対象のメトリック | Memory% | 監視対象のホストメトリック名 |
監視対象の絞込 | KCPSManagedOption:kcps | 監視設定が登録されるロール名/サービス名 | |
アラートの発生条件 | Warningの条件 | 70 | warningのAlert発生の閾値 |
Criticalの条件 | 70 | criticalのAlert発生の閾値 | |
条件の持続時間 | 5 | 設定した間隔(分)の平均値を監視 | |
基本設定 | 監視ルール名 | Memory% (KCPS) | Mackerel管理画面に表示される監視名 |
・2.2.3 ディスク容量
設定項目名 | 設定値 | 概要 | |
---|---|---|---|
監視対象 | 監視対象のメトリック | Filesystem% | 監視対象のホストメトリック名 |
監視対象の絞込 | KCPSManagedOption:kcps | 監視設定が登録されるロール名/サービス名 | |
アラートの発生条件 | Warningの条件 | 90 | warningのAlert発生の閾値 |
Criticalの条件 | 90 | criticalのAlert発生の閾値 | |
条件の持続時間 | 3 | 設定した間隔(分)の平均値を監視 | |
基本設定 | 監視ルール名 | DISK% (KCPS) | Mackerel管理画面に表示される監視名 |
3.イベントログ監視(Windowsの場合)
- 3.1 監視対象
Windows系OSがインストールされている仮想サーバー
- 3.2 監視設定内容
設定項目 | 設定値 | 概要 |
---|---|---|
プラグイン名 | plugin.checks.kcps_eventlog | ログ監視を実現するプラグインの名称 |
イベントタイプ | Error | 検知するログの種類 |
Mackerelへの送信 | 有効 | 検知した内容をMackerelへ送信 |
※1分ごとに監視状態をチェックします。前回のチェック以降にアラートが発生しなかった場合は、アラートがクローズされます。
例1. アラート発生後、アラート発生条件を満たすログが出力されなかった場合
【事象】:アラート発生→次の監視状態チェックまでに、アラート発生条件を満たすログが出力されない
【結果】:アラートはクローズされます
例2. アラート発生後、アラート発生条件を満たすログが出力された場合
【事象】:アラート発生→次の監視状態チェックまでに、アラート発生条件を満たすログが出力された
【結果】:アラートが継続します
例3. アラートクローズ後、再度アラートが発生した場合
【事象】:アラート(1)発生→監視状態チェックまでに、アラート発生条件を満たすログが出力されない→再度アラート(2)発生
【結果】:アラート(1)はクローズされ、別アラートとしてアラート(2)が発生します
4.ログ監視(Linuxの場合)
- 4.1 監視対象
Linux系OSがインストールされている仮想サーバー
- 4.2 監視設定内容
設定項目 | 設定値 | 概要 |
---|---|---|
プラグイン名 | plugin.checks.kcps_log_messages | ログ監視を実現するプラグインの名称 |
監視ファイル | /var/log/messages | 監視するファイルのパス |
検知文言 | warning|error|emerg|alert|critical | 検知する文言 |
※1分ごとに監視状態をチェックします。前回のチェック以降にアラートが発生しなかった場合は、アラートがクローズされます。
※検知文言がアラート発生途中で変わってもアラートが継続している場合は、同一アラートとして処理されます。
例1. アラート発生後、アラート発生条件を満たすログが出力されなかった場合
【事象】:アラート発生→次の監視状態チェックまでに、アラート発生条件を満たすログが出力されない
【結果】:アラートはクローズされます
例2. アラート発生後、アラート発生条件を満たすログが出力された場合
【事象】:アラート発生→次の監視状態チェックまでに、アラート発生条件を満たすログが出力された
【結果】:アラートが継続します
例3. アラートクローズ後、再度アラートが発生した場合
【事象】:アラート(1)発生→監視状態チェックまでに、アラート発生条件を満たすログが出力されない→再度アラート(2)発生
【結果】:アラート(1)はクローズされ、別アラートとしてアラート(2)が発生します