KDDIクラウドプラットフォームサービス ナレッジサイト

  • HOME
  • KCPS Ver.1のみ提供しているサービス・機能等
  • 構築・運用オプション(概要)

構築・運用オプション(概要)

  • 「マネージドオプション」リリースに伴う「構築・運用オプション」の提供条件見直しについて
    ・KCPS ver2をご利用、かつ「構築・運用オプション」をこれからご利用希望のお客さまは、
    「マネージドオプション」をご利用ください。
    ※KCPS Ver2新規のお客さまで、「構築・運用オプション」をご利用したい場合は、
    KDDI 法人営業担当者へお問い合わせください。
    ・KCPS ver2で「構築・運用オプション」をご利用中のお客さまは、「構築・運用オプション」を
    継続してご利用いただけます。
    ・KCPS ver1をご利用のお客さまは、「構築・運用オプション」を継続してご利用いただけます。
    ・「マネージドオプション」は、KCPS ver2のみご利用いただけます。
    ・「マネージド オプション」は、監視エージェントのインストールが必要となります。
    監視エージェントがインストールできない場合(例:拡張LB)は、「構築・運用オプション」の
    「エージェントレス監視」を引き続きご利用いただけます。

 

  • 構築・運用オプションとは、KDDIにて仮想サーバー(ゲストOS)およびアプリケーションサーバーの構築・運用を実施するオプションです。
  • ご利用には基本メニューが必要となり、申込書にて請けたまわります。
  • お客さまのご要件にあったより高度な構築・運用を要望される場合、基本メニューにアドオンメニュー加えることで利用可能となります。
  • 本オプションが適用されるインスタンスは、テンプレートにインストール済の監視エージェント(Zabbix Agent)を利用致します。

【前提条件】

  • KDDIクラウドプラットフォームサービスのサービス基盤保守運用は契約約款に含まれています。本オプションはKCPSサービス基盤の上に構築した仮想OSより上位の運用が対象となり、保守運用はKDDIソリューションサービス基本要綱 第6章 マネージメントサービス に含まれます。
  • KDDIクラウドプラットフォームサービスのサービス基盤の故障発生時はシステムより同報メールにてご連絡致します。本オプションで検知したアラーム通知は、お申し込みいただいている障害連絡先に連絡をします。通知手段はメール、もしくは電話連絡となります。お申し込み時に特段のお申し入れがない場合はメールとなります。
  • アラーム検出~メール/電話連絡にかかる時間はベストエフォートとなります。
  • お客さま側のメンテナンス作業などにより大量にアラームを検知し共通監視設備が高負荷状態になっている場合はサービス提供を一時停止させていただきます。アラームが発生する作業を実施する場合は事前にKCPS運用窓口にご一報ください。
  • カスタムについては監視サービス対象外となります。
  • 持込みOSを使用の際、またはエージェントレス監視の際はKDDIから送付するチェックシートのご提出が必要です。
  • アドオン運用メニューについては基本監視を導入している仮想サーバーへの提供となります。
  • アドオン監視メニューについてはオフィシャルテンプレートから作成された仮想サーバーのみの提供となります。
  • オフィシャルテンプレートの中でも拡張LB「vThumder」については監視エージェントが導入できないため、エージェントレス監視による基本監視メニューのみのご提供となります。
  • 複数のご担当者様での通知受け取りをご要望の場合は、メーリングリストをご用意のうえ、メール通知をご指定頂けますようお願いいたします。電話連絡で複数の連絡先を指定する、または連絡順を指定することはできません。
  • 電話連絡ご希望の場合、一度かけて不通時は留守番電話および申込時にいただいた故障時連絡先のメールアドレス宛にメール致します。
  • メール連絡または電話の連絡は、KCPS契約申込書の故障時連絡先にご記入頂いたお客さまの部署・氏名に対して連絡を致します。
  • 監視設定変更時は作業費として初期費用と同額が必要です。解約時の費用は必要ありません。
  • 監視間隔やアラーム条件の変更はできません。
  標準テンプレートOS
(一部除く)
一部の
標準テンプレートOS
持込みOS
基本監視
・Ping監視
・Port監視
× ×
基本監視(エージェントレス監視)
・Ping監視
・Port監視
アドオン監視
・リソース監視
・プロセス監視
・ログ監視
× ×
アドオン運用
・リモート障害対応
・ベンダ手配代行

※一部の標準テンプレートOSとは、「vThunder」を表します。

 

【基本メニュー仕様】

名称 運用業務 内容 詳細
基本監視 Ping監視

・当社監視サーバーからインスタンスのMonitoring SegmentのNICへICMP Pingポーリングし、応答をチェック

・監視エージェント(Zabbix Agent)の死活チェック

※エージェントレス監視ではICMP Ping監視のみとなります。
※ICMP PingダウンとZabbix Agentダウンが同時間帯に検知された場合、ICMP Pingを優先検知し、Zabbix Agentダウンは検知しません。
※Zabbix Agent監視はインスタンスの死活状況をより正確に判断するための補助的なサービスとなりますため、監視サービスのお申込書には記入欄はございません。エージェントレス監視を選択されない限りは、自動的にZabbix Agent監視も含まれます。

[ICMP Ping]
監視間隔=100秒
警告レベル=致命的アラート
条件=300秒間応答なし[Zabbix Agent]
監視間隔=300秒
警告レベル=致命的アラート
条件=900秒間応答なし
Port監視 指定されたポート番号に対するTCP接続の可否をチェック(net.tcp.service監視)
※エージェントレス監視ではnet.tcp.service監視となります。
監視間隔=100秒
警告レベル=致命的アラート
条件=3回連続で接続否(上限5ポートまで)
基本監視セット ゲストOS構築込で基本監視をセット提供
※基本監視セットは持込みOSは対象外となります。
お客さまにかわり、ゲストOS構築作業を実施し基本監視も設定します。
(*1)※アプリケーション含めた構築が必要な場合は、ご相談ください。
追加Port監視 指定したポートの監視 基本監視のPort監視で6ポート以上必要な場合に追加を受けたまわります。

※エージェントレス監視とは持込みOS、vThunderが適応されます。
※基本監視セットはエージェントレス監視は対象外となります。

  • Admin Console操作のサーバー停止時は、監視アラートを検知しない(自動的に抑止される)仕様となります。(例外としてログ監視を行っている場合、サーバーシャットダウン中(Zabbix Agentサービスの停止後)に記録されたログは、サーバー起動後に検知する場合があります)
  • アラート検知時のお客様への通知手段はメール、もしくは電話連絡となります。お申し込み時に特段のお申し入れがない場合はメールとなります。
  • テンプレートより作成されたサーバーの監視については監視対象サーバーにAgent監視を行います。監視(Zabbix)エージェントを削除しないようにお願いします。
  • 監視設定されているサーバーを再構築した場合、監視設定が外れますので、再度監視設定の依頼をいただく必要がございます。
  • 監視サーバーからホスト(監視対象のサーバー)に対して、TCP 10050番ポートでの通信が必要になります。
  • Port監視を実施する場合、監視対象のサーバーは、自分自身の監視LAN側のアドレスから自分自身の監視LAN側のアドレスに対して、指定したポート番号に接続できる必要があります。
  • 基本監視セットで構築したサーバーについて、OS固有の問題調査については、お客さま引渡し完了までとなります。

*1 Admin Console作業の代行となります。

【アドオンメニュー仕様】

名称 内容 詳細
リソース監視 CPU使用率監視 監視間隔=100秒
警告レベル=警告
アラート条件=5分間平均が3回連続で閾値超え
閾値(初期値:90%以上)=お客さま指定
監視間隔=100秒
警告レベル=致命的
アラート条件=5分間平均が3回連続で閾値超え
閾値(初期値:95%以上)=お客さま指定
メモリー使用率監視 監視間隔=100秒
警告レベル=警告
アラート条件=3回連続で閾値超え
閾値(初期値:80%以上)=お客さま指定
監視間隔=100秒
警告レベル=致命的
アラート条件= 3回連続で閾値超え
閾値(初期値:90%以上)=お客さま指定
ディスク使用率監視 監視間隔=100秒
警告レベル=警告
アラート条件= 3回連続で閾値超え
閾値(初期値:80%以上)=お客さま指定
監視間隔=100秒
警告レベル=致命的
アラート条件= 3回連続で閾値超え
閾値(初期値:90%以上)=お客さま指定

・CPU監視において、1台のサーバーで複数CPUを保有している場合は、全CPU合計の使用率となります。

【アドオンメニュー仕様】

名称 内容 詳細
プロセス監視 プロセス監視 監視間隔=100秒
警告レベル=致命的
アラート条件= 3回連続でプロセスなし
ログ監視 文字列(キーワード)監視 監視間隔=300秒
警告レベル=警告 or 致命的
アラート条件=対象のログに指定された文字列(キーワード)が出力
監視対象のログ=お客さま指定 (Exp: /var/log/messages)
文字列(キーワード)=お客さま指定【設定NG例】(アラーム多発するため)
(1)“critical” “error” ”warning” ”info” いずれかの文言が含まれた場合は検知
(2)”error” 以外の文言は正規表現アスタリスクで検知
(3)Windowsログで”警告”レベルや”エラー”レベルのログはすべて検知【設定OK例】 “障害が発生しているアプリケーション名:smc.exe”かつ “Symantec Management Client サービスは予期せぬ原因により終了しました”の文字列が両方ともログに記録された場合は検知
その他の監視 お客さまのご要件に基いた監視設定 基本監視・アドオンメニューの仕様に縛られない自由な設計が可能です。
また、基本監視・アドオンメニューにない監視項目についてもご相談いただくことが可能となります。
  • ログ監視を実施する場合、監視対象のサーバーから監視サーバーの監視ネットワークに対して10051番ポートでの通信が必要になります。
  • ログ監視で指定する文字列(キーワード)には、正規表現(Posix形式)を使用することが可能です。(次頁)
  • ログ監視において、監視対象サーバーのOSがLinux系の場合、対象のログファイルにZabbixアカウントでの読み取り権限が必要になります。
  • ログ監視の上限として、64KBを超えない行末までを1度に読み込むという動作になります。そのため、1行が64KBを超える形式のログの場合、必ずしも期待した動作をしない可能性があります。
  • その他の監視をご要望される場合は、通常納期 (基本5営業日+アドオン5営業日)とは異なります。要件確認・監視試験等、ご要望の内容に依存し、納期は個別の調整となります。

【アドオンメニュー仕様】

名称 内容 詳細
リモート障害対応 1障害対応当たり1手順書必要です。(お客さまご準備)1障害対応当たり10分程度の内容とさせていただきます。※手順作成請負い、または長時間の対応内容の場合はご相談ください。 確認コマンドの実施
情報取得(ログなど)
サーバーの起動/停止
ワークアラウンド手順の実施
ベンダ手配代行 あらかじめ指定されたベンダー様に連絡

そのほかに、IT運用管理業務の提供についてもご相談ください。

【禁止操作】

  • 下記操作を監視対象となる仮想インスタンスで実施しないでください。監視が正常に行えなくなります。
    • Zabbix Agentのサービス(Windows)、プロセス(Linux)を停止
    • Zabbix Agentのコンフィグの変更
    • Zabbix Agentの起動マクロ、およびサーバー起動時に起動マクロを動作させるためのタスクスケジューラ(Windows)やスタートアップスクリプト(Linux)の変更
    • 監視用NIC(monitoring segment)のIPアドレス設定をOS内で変更
    • Windows FirewallやIPtablesでZabbixの通信やICMPのポーリングを阻害してしまう
    • 監視対象ログファイルのファイル名やファイルパスを変更
    • Monitoring Segment(198.x.x.x)へのroute情報を削除。

【監視検知できないケース】

  • <死活監視(Ping)>
    • 仮想サーバーのOSがハング、もしくは高負荷によりフリーズ状態に陥っている場合で、NICだけはICMP応答が可能な場合がありますので、サーバーダウンと判定できない場合がございます。
  • <Agent監視>
    • 監視対象の仮想サーバー自体が高負荷におちいっており、Zabbix Agentが監視サーバーへデータ送信ができなくなっている時は、監視サーバーが仮想サーバーの状況を判定する事ができないため、アラート検知ができません。
    • Zabbix Agentのプロセス自体がハングしている場合は、監視サーバーへデータ送信ができなくなるため、アラーム検知ができません。その際はZabbix Agentの再起動をお願いする場合が御座います。

【お客さまトーク例】

  • 下記の通り、発生したアラーム(トリガー名)をそのままお伝えします。
    ○時○分に {ホスト名} にて {トリガー名} を検知しました。
    例)
    Agent監視

      • 「○時○分に <お客さまインスタンス名> にて <お客さまインスタンス名>_is_down を検知しました。」

    Port監視

      • 「○時○分に <お客さまインスタンス名> にて Port80_is_down を検知しました。」

    リソース監視

      • 「○時○分に <お客さまインスタンス名> にて CPU0_utilization_is_very_high を検知しました。」

    プロセス監視

        • 「○時○分に <お客さまインスタンス名> にて Apache_is_down を検知しました。」

    ログ監視

        • 「○時○分に <お客さまインスタンス名> にて Error(/var/log/messages) を検知しました。」

KCPS Ver.1のみ提供しているサービス・機能等

2021/09/17 2021/09/17