KDDIが標準的に提供する監視項目
死活監視
- 仮想サーバが正常に稼動しているかどうかを、仮想サーバーにインストールされたMackerelエージェントとMackerelサーバーとの通信を確認することで実現します。
項目 |
内容 |
アラート発報条件 |
エージェント側からMackerelサーバ-側へ約10分間情報の送信が確認できない場合にサーバー側にてアラートを発生します。 |
補足 |
初期の閾値に関しては、変更できません。 |
リソース監視
- リソース監視はMackerelエージェントから送信されるメトリックとよばれるMackerelの標準機能を利用することで、仮想サーバのリソースの負荷状況などを確認することができます。
この情報に対して、閾値を設けることができ、閾値に対して、WarningとCriticalの2段階のアラームを設定することができます。
- 閾値は送信される値との比較になりますが、CPU使用率およびメモリー使用率は割合で指定します。
- KDDI標準監視テンプレートに含まれるメトリック監視には以下の3つの項目があり、それぞれ初期値を設定します。
- リソース監視においては時系列の経過をMackerelのグラフ表示機能により、表示することが可能です。グラフ表示の期間は400日です。
監視対象一覧 |
|
Windows |
Linux |
リソース監視 |
CPU |
Warning 70% Critical70% |
Warning 70% Critical 70% |
Memory |
Warning 70% Critical 70% |
Warning 70% Critical 70% |
Disk |
Warning 90% Critical 90% |
Warning 90% Critical 90% |
KDDI標準提供内容以外の監視項目
- 初期設定時に、デフォルトで監視する項目以外に、ユーザーがプラグインをインストールし設定することで監視できる項目は以下の通りです。
- これらの監視項目に関してはMackerelエージェントが読み込むConfigurationファイルに直接設定するものと、Mackerelの管理画面で設定することによって可能となります。
項目 |
内容 |
Configurationファイルへの記載によって可能となる監視項目 |
プロセス監視 |
ポート監視 |
ログ監視 |
Mackerelの管理画面を利用して可能となる監視項目 |
URL外形監視 |
プロセス監視
- Linux系OSのプロセス監視を行います。
該当プロセスの有無を監視します。
サービス監視
- WindowsOSのサービス監視を行います。
該当サービスの有無を監視します。
ポート監視
- Windows OS,CentOSなどの指定した通信ポートの監視を行います。
ポート監視は外部から該当ポートに対するポーリングではなく、エージェントが仮想サーバー内部のポートに対してポーリングを行うことで監視を実施します。
ログ監視
- Windows OS,CentOS等の指定したログファイルの監視を行います。
- Mackerelではログ監視に関して、イベントログ、テキストログという2つの種類があります。イベントログ監視はWindows に対して利用され、テキストログ監視は主にLinux系に利用しますが、Windowsにおいても利用は可能です。
- イベントログ監視はWindowsのイベントログに特化して確認しますが、テキストログは任意のテキスト形式のログ全般に利用可能です。
初期監視対象一覧 |
Windows(R) |
Linux |
ログ監視 |
Applicationログの以下条件に合致するメッセージ |
ログ上以下条件に合致するメッセージ |
Critical |
warning |
- Error |
error |
- AuditFailure |
emerg |
Warning |
alert |
- Warning |
critical |
URL外形監視
- httpまたはhttpsに対しての監視を行うことが可能です。
以下の各項目に値・名称を記述して作成ボタンをクリックすることで監視が開始されます。
設定項目 |
内容 |
URL(必須) |
httpまたはhttpsを選択し、それ以後のURLを記述することで監視対象となります。 |
レスポンスボディのチェック(任意設定) |
レスポンスボディに指定の文字列が含まれているかをチェックします。指定された文字列がレスポンスボディに含まれていない場合、アラートが発信されます。 |
HTTP リクエストヘッダ(任意設定) |
リクエストに任意のHTTPヘッダを指定可能です。User-Agent は Mackerel-http-checker/0.0.1 のようなフォーマットとなり編集できません (/ 以降はバージョン番号であり、将来的に変化します)。デフォルトで Cache-Control ヘッダに no-cache が指定されています。 |
<通知の再送間隔(任意設定)/td> |
アラートの状態が、指定された時間を超えても変化がない場合、再度通知します。 |
証明書の有効期限の監視(任意設定) |
SSL証明書の有効期限を監視します。有効期限の残り日数が閾値下回った場合、アラートが発信されます。 |
監視ルール名 |
本監視定義の名称 |
アラートの発生条件
- 指定したURLに毎分接続を行い、次の条件でエラーと認識して、アラート通知を実施します。
- ステータスコードが、4xxまたは5xx系の場合
- タイムアウト(15秒)となった場合
- SSL証明書が不正の場合
- レスポンスタイムが閾値を超えている場合(任意設定)
- レスポンスボディに指定文字列が含まれていない場合(任意設定)
- SSL証明書の有効期限の残り日数が閾値を下回っている場合(任意設定)
ロール内異常検知 (当機能はマネージドオプションBasicのご利用料金に加え別途料金となります)
- 同じ役割のLinux系OSを実行するサーバをひとまとめにしたロールの、普段の動作傾向をAIによって機械学習し、普段の傾向から外れるものを異常として検知することができます。
- 従来のような閾値ベースでは検知の難しかった小さな変化もロール内異常検知によって発見しやすくなります。
- お客さまは「感度」を3段階から選択するだけで、機械学習の専⾨知識がなくても最短1⽇程度の学習データから異常を検知できるようになります。
- ホストへの細かい監視設定が漏れていたとしても、ロール内異常検知を設定しておくことによって検知できる可能性を⾼められます。
- 静的な閾値として監視の設定を決めかねている新しいシステムに対し、「最⼩限の監視設定」と「ロール内異常検知」を組み合わせて設定、その環境下にて運⽤することで、より適切な監視設定を⾒定めていくことの助けとすることができます。
Mackerelの障害発生時など最新情報の取得方法
Mackerelに障害が発生した場合、最新情報がTwitterの @mackerelio_jp及びステータスページ status.mackerel.ioに公開されます。
また、ステータスページ status.mackerel.ioのページ上部にSubscribeボタンがあり、そちらからメールアドレスを登録することもできますので必要に応じてご利用ください。RSSフィードもこちらのボタンから取得可能です。
なお、ステータスページ、各種通知方法とその機能につきましてはMackerelを提供する株式会社はてな様のサービスとなります。弊社ではメールアドレスの登録や解除は致しかねますのでご了承ください。