本文へジャンプ

ミドルウェア

uVALUE 実業×IT

Hitachi

仮想環境を含むシステム全体の稼働状況を効率良く管理する

サーバの稼働管理には、突発的に発生する問題を未然に防いだり、発生した問題を効率良く解決するトラブルシューティングと長期間の監視から得られるキャパシティプランニングの両面からの監視が必要です。
JP1サーバ稼働管理では、トラブルの予兆を検知するアラーム監視や、収集した稼働情報からトラブルの原因究明・チューニングに役立つレポート機能が充実。さらに、長期間の監視で得られた稼働情報やレポート出力の結果などから今後ボトルネックになりそうな箇所を特定でき、キャパシティプランニングにも役立ちます。

Windows®、UNIX、Linux®で構築された分散システム上のOS、データベース、インターネット・サービス、各種アプリケーション、さらには仮想環境などの稼働情報をさまざまな側面から収集。これらの情報を一元管理して横断的に分析することで、安定したシステムの稼働を支援します。

サーバ稼働管理イメージ

エージェントをインストールしないリモート監視

監視対象サーバに監視エージェントをインストールしないでサーバの稼働状況をリモート監視できます(エージェントレス監視)。監視エージェントをインストールする必要がないため、稼働中のシステムに対しても、すぐに監視が始められ、稼働監視システムの導入コストも削減できます。また、監視対象サーバに監視による負荷をかけたくない場合にも適しています。

エージェントを使う監視との共存が可能

サーバの稼働状況をより詳細に監視したい場合には、監視対象サーバに監視エージェントをインストールして監視する方法が適しています(エージェント監視)。サーバの重要度に応じて、監視項目の充実したエージェント監視で強力に監視する方法と、エージェントレス監視で簡易的に監視する方法を組み合わせることができるので、さまざまなシステム要件に柔軟に対応できます。

「エージェントレス監視」と「エージェント監視」、両方の監視方法を組み合わせて適切なシステム監視を実現する構成イメージ。
画像を拡大する

IIS:Microsoft® Internet Information Services 
JP1/AJS3:JP1/Automatic Job Management System 3 

すぐに監視が始められるテンプレート

危険域や警告域のしきい値に達した際にシステム管理者へ通知する方法や、レポートの表示形式を定義済みテンプレートとして標準提供。インストール直後からスムーズに運用を開始できます。

わかりやすい操作メニュー(クイックガイド)

クイックガイド画面では豊富な監視項目の一覧を確認でき、操作したいフィールドのアイコンから監視の設定やリアルタイムレポート、履歴レポートを表示できます。また、レコードやフィールドと説明文が表示されるので、見たい監視項目をワンクリックで表示でき、簡単に操作できます。

クイックガイド画面、レポート画面

監視項目のキーワード検索機能

監視したい項目のキーワード、たとえば「CPU」「メモリー」「TCP」といった用語から、関連する監視項目を検索できます。さらに、検索結果画面には監視項目(フィールド)の説明が表示されるので、それらを見ながらレポートやアラーム作成時の監視項目を選定できます。

キーワード検索画面

監視エージェントの一括定義

監視対象サーバの数が多い場合にネックとなるのが、各エージェントの設定作業です。JP1なら、複数エージェントに対して一括定義が可能。たとえば、1台のエージェントに対して稼働情報の収集条件を定義すれば、その定義情報をコピーして他のエージェントに配布することができます。初期導入時の構築作業やエージェントの追加作業が省力化できるだけでなく、設定ミスの削減にもつながります。

監視対象サーバ(監視エージェント)

監視はシステム情報サマリ監視画面で直感的に

システム全体のサーバやエージェントの稼働状況、エージェントのアラーム監視状況などを部署やシステムごとにフォルダ分けして、システム情報サマリ監視画面にビジュアルに表示します。1つの画面でシステム全体の稼働状況を直観的に把握できます。

システム情報サマリ監視画面

仮想マシンと物理サーバの両面から監視

仮想マシンだけではなく、物理サーバも含めたシステム全体の稼働監視が可能。その結果、仮想環境での問題の予兆検知はもちろん、物理サーバのリソースを有効活用した仮想環境の構築を支援します。

負荷を最小限に抑えるパフォーマンス管理

稼働情報の収集では、「どのサーバの、どの項目の稼働情報を、どのタイミングで取りに行く」といった詳細な設定が可能です。監視・分析に必要なデータだけを収集・蓄積できるため、監視対象のサーバやデータベースに余分な負荷をかけずに効率良く管理できます。

安定した監視環境で幅広いニーズに合わせた監視を実現

サーバやプロセスの状態はもちろん、監視エージェントのサービス状態をリアルタイムに監視できます。監視エージェントが停止した場合も自動的に再起動するため、監視運用を継続できます。
また、ユーザーアプリケーションや他管理ツールで取得した情報を監視対象として設定できるなど、お客さまのシステムに特化した情報も監視できます。

問題の事前検知と連動した自動アクション

危険な状態になる前に、システム管理者へのメール通知や外部コマンドを自動実行するアラーム機能を提供。問題発生の未然防止に役立ちます。

JP1でシステム全体の稼働監視を!

JP1サーバ稼働管理は、仮想環境、プラットフォーム、データベースやWebアプリケーションサーバなどのミドルウェア、サービスレベルを評価するサービスレスポンスなど、システム全体を包括的に監視できます。

JP1サーバ稼働管理の監視対象

トラブルシュートとキャパシティプランニング

稼働監視の運用サイクル(監視〜原因究明・分析〜対処)には2種類あります。1つは、突発的な問題に対するトラブルシュートのサイクル。もう1つは、長期間収集した稼働監視をいかすキャパシティプランニングのサイクルです。JP1サーバ稼働管理はどちらのサイクルにも必要な機能を備えています。システムの安定稼働のためには、両方のサイクルを繰り返しながら監視を継続していくことが肝要です。

プロセスやWindows® サービスの稼働監視

業務サーバで稼働しているアプリケーションのプロセスやWindows®サービスの死活監視をはじめ、プロセスごとの稼働情報を監視できます。異常を検知すると、どのアプリケーションのどのプロセスが異常なのかをレポートでリアルタイムに確認できます。

レポート画面(アプリケーションの詳細)

プロセスの死活監視をエージェントレスで実現

プロセスやWindows®サービスの死活監視をエージェントレスで実現できます。エージェントレス監視は監視対象サーバにエージェントをインストールする必要がないため、稼働中のシステムに対してもすぐに死活監視が始められます。

プロセス監視定義の入力支援

プロセス監視の定義画面で実際の稼働プロセスやWindows®サービスを確認しながら定義ができます。フィルタリング機能で関連のあるプロセスを絞り込んで表示することもできるので、入力ミスの低減と作業効率の向上につながります。また、プロセスごとに稼働数の上限・下限の設定もできます。

稼働中のコマンドライン一覧画面、アプリケーション監視定義新規作成画面

そのほか、監視アプリケーションごとにテンプレートを作成すれば、サーバの増設時に利用できます。テンプレート化することで定義内容を管理できます。

監視アプリケーションごとのテンプレート作成

インターネット・サービスの応答時間を計測

HTTP、HTTPS、SMTP、POP3などのインターネット・サービスの応答時間を計測することによって、サービスの利用者にとって適切なサービスが提供できているかを監視できます。計測条件に従ったリクエストを定期的に送信し、レスポンス時間やスループットを計測できます。

Webトランザクションの監視

サービス利用者の一連の操作を想定したシナリオを作成し、その応答時間を計測できます。ログインを伴うWebアプリケーションの計測も可能。測定結果をレポート表示すれば、レスポンスが低下する時間帯や傾向を視覚的に確認でき、レスポンス低下の原因分析に役立ちます。

Webトランザクションの監視

勘に頼らないキャパシティプランニング

データの自動集計

稼働情報を蓄積しながら、分、時、日、週、月、年単位で自動集計できます。さらに、集計データの保存期間を指定することで、一定のディスク使用量を保ち、サーバリソースを浪費する心配がありません。

稼働状況を相対的に評価

蓄積された稼働情報をもとにシステムの稼働状況の変化を過去の稼働実績データ(基準:ベースライン)と比較して相対的に評価できます。これにより、勘に頼らないキャパシティプランニングを支援します。

ベースライン比較:CPU利用率(現在と過去)

システムリソースの投資計画を支えるレポート機能

稼働状況データのレポートは、チューニングやシステムリソースの増設などの検討に欠かせない資料として利用できます。

長期間にわたる稼働情報を効率良く管理

期間を指定した差分バックアップによって、稼働情報のバックアップ負荷を軽減。数年分の稼働情報を、監視を止めることなく効率良くバックアップできます。

CSV形式、HTML形式でレポート出力

CSV形式またはHTML形式でレポートを出力できます。これにより、CSV形式で出力して解析用データとして活用したり、HTML形式で出力した稼働状況レポートを社内で参照したりできます。

レポートは自動的に出力

[ジョブスケジューラ:JP1/Automatic Job Management System 3]を利用すると、毎日、毎週、毎月のレポート出力も自動的に行えます。

複数のレポート表示で効果的な障害要因分析

あらかじめブックマークに登録した複数のレポートを並べて表示できます(タイリング表示)。複数のレポートを並べて表示することで、効果的な障害要因の分析やキャパシティプランニングに役立ちます。

レポートのタイリング表示画面

ドリルダウンで詳細データや関連データをすぐに表示

レポート作成時にあらかじめドリルダウンの設定をすることで、グラフをクリックするだけで詳細データや関連データを表示できます。特定の期間のデータを詳しく見たい場合や関連するサーバのデータを調査したい場合などに役立ちます。

レポート画面(ドリルダウンの例)

業務システムを止めないためのシステム監視

いつも問題なく動作している業務システムも、実行状況を詳しく見てみると、実は危険な状況が隠れていたりします。JP1サーバ稼働管理は、業務の滞留数や滞留時間などを監視し、業務が危険な状況になる前に検知してシステム管理者に通報。業務システムを止めないためのシステム監視を実現します。また、豊富なレポート機能は問題の原因究明に役立ちます。

ハードディスクやメモリーといったリソースと各種アプリケーションが複雑に絡み合った仮想環境では、正確に稼働状況を把握することは容易ではありません。JP1サーバ稼働管理は、仮想マシンだけではなく、物理サーバも含めたシステム全体の稼働監視を実現。
仮想環境での問題の予兆検知はもちろん、対策が必要な物理サーバの特定が容易です。また、収集した稼働情報によって、仮想マシンと物理サーバの両面を考慮した適切な対処ができるので、システム全体の安定稼働を維持できます。さらには、物理サーバのリソースを有効活用した仮想環境の構築にもつながります。

仮想環境でのサーバ稼働監視運用例

監視:仮想マシンのリソースを監視。問題の予兆を検知したら、画面上で問題となった仮想マシンおよび物理サーバをすばや特定。原因究明・分析:稼働情報を仮想マシンと物理サーバの両面から分析。仮想環境のリソース配分の見直しやリソースの増強などの判断が可能。対処:リソースの過不足傾向を把握した上で、[仮想マシン管理:JP1/Integrated Management - System Center Virtual Machine Manager]などを利用して「リソース配分の見直し」や「リソースの増強」などの対処を実施。

種 別 監視対象 主な監視項目
プラットフォーム Microsoft® Windows Server® 2008、 Microsoft® Windows Server® 2003
  • CPU/メモリー/ディスク使用状況
  • ディスクアクセス状況、ネットワーク使用状況(IPv4/IPv6)
  • プロセス単位の詳細情報
  • プロセス数の上限値/下限値
  • デバイス情報
  • サービス情報
  • イベントログ
  • Active Directoryのレプリケーションのトラフィック

    など

Solaris、AIX、HP-UX、Linux
  • CPU/メモリー/ディスク使用状況
  • ディスクアクセス状況
  • プログラムごとのユーザー稼働状況
  • プロセス稼働状況
  • アカウント・プロセス状況
  • プロセスごとのシステム資源使用状況
  • プロセス数の上限値/下限値
  • コンソール・メッセージ
  • ネットワークデータ転送量および使用状況
  • ネットワークコリジョン
  • プロセス/クライアント/ファイルシステムのアクセス状況

    など

仮想環境* VMware® ESX、
Microsoft® Hyper-V™、
Virtage
  • 物理サーバ・仮想マシンごとのCPU使用率および使用量
  • CPU不足率
  • CPUの割当上下限値・均衡値
  • メモリー使用量
  • スワップI/O
  • ワーキングセットサイズ
  • ワーキングセットサイズ率
  • メモリーの割当上下限値
  • メモリー未使用量
  • メモリー割当量
  • スワップ使用量
  • ディスクのコマンド破棄率
  • 論理ディスクごとの使用率・使用量
  • データストアのディスク使用量
  • ネットワークデータ送受信速度

    など

データベースサーバ Oracle® Database
  • CPU使用状況
  • 各種メモリー使用状況
  • I/Oキャッシュ・ヒット率
  • ソート情報
  • ネットワークの使用状況
  • プロセス単位の詳細情報
  • データベース使用率
  • テーブル・スペース情報
  • フラグメンテーション
  • ロック発生情報
  • SQL情報
  • エラー情報
  • パラメーター情報

    など

Microsoft® SQL Server
  • CPUの使用状況
  • データベーススペース使用状況
  • キャッシュヒット率
  • ネットワークの使用状況
  • 環境設定情報
  • ロック発生情報
  • エラー情報

    など

IBM® DB2® Universal Database™
  • 各種メモリー使用状況
  • I/Oキャッシュ・ヒット率
  • ソート情報
  • SQL情報
  • エラー情報
  • 構成パラメーター情報

    など

HiRDB
  • バッファ情報(実I/O回数、ヒット率など)
  • ロック資源情報
  • トランザクション数
  • ロールバック率
  • HiRDB プロセス稼働情報
  • ログ入出力エラー回数
  • サーバとクライアントのネットワーク制御情報
  • データベース スペース利用状況
  • HiRDBファイルシステムスペース利用状況
  • HiRDBサーバ情報

    など

グループウェア IBM® Domino
  • エージェント実行情報
  • ドミノ情報
  • データベース情報
  • ICM情報
  • IMAP情報
  • LDAP情報
  • ローカルディスク情報
  • Notesメール情報
  • サーバメモリー情報
  • 滞留・Deadメール情報
  • ネットワーク情報
  • NNTP情報
  • データベース複製情報
  • サーバ情報
  • ドミノへルスチェック情報
  • Notesログ情報
  • Webサーバ情報

    など

Microsoft® Exchange Server
  • キュー/メッセージ
  • ユーザーログオン
  • プライベート/パブリック情報
  • サーバ/システム情報
  • プロセッサ
  • メモリー
  • プロセス
  • ディスク/ページファイル
  • ネットワーク
  • 最大送信者/受信者
  • インターネットメール接続
  • 未使用メールBOX
  • Exchange固有性能値

    など

Webサーバ Microsoft® Internet Information Services
  • 各種接続
  • ファイル転送
  • 各層別転送率
  • ASPスループット
  • 帯域制限
  • ワーキングセット
  • スレッド
  • プロセッサ
  • ディスクパラメーター
  • NotFoundエラー

    など

Webアプリケーションサーバ IBM® WebSphere® Application Server
  • JVMランタイムのメモリー使用率/CPU使用率/ガーベッジコレクション所要時間
  • 動的キャッシュのヒット率
  • スレッドプールの使用率
  • JDBC接続プールの使用率
  • J2C接続プールの使用率
  • Webアプリケーションの セッション数
  • サーブレットの平均応答時間
  • トランザクションのコミット数/ロールバック数
  • Webサービスの 平均応答時間
  • IBM® WebSphere® Application Serverの状態

    など

Oracle® WebLogic Server
  • Javaヒープ使用率/GC回数/GC実行時間
  • スレッドプールの使用率/キューに滞留中のリクエスト数
  • コネクションプールの使用率/待ち接続要求数
  • サーブレットの呼び出し回数/平均実行時間
  • EJBプール 内のインスタンス数/キャッシュヒット率
  • JMSの格納メッセージ数/保留メッセージ数
  • トランザクションのコミット数/ロールバック数
  • BEA WebLogic Server®の稼働状態

    など

uCosminexus Application Server
  • Javaヒープ使用率/GC回数
  • ステートフルセッションBeanのセッション数
  • ステートレスセッションBeanの インスタンス数
  • メッセージドリブンBeanの受信メッセージ数
  • リソースアダプタのコネクションプールの使用状況
  • トランザクションサービスの処理数
  • uCosminexus Application Serverの稼働状態

    など

メッセージキューイングシステム IBM® WebSphere® MQ
  • キューマネージャーの稼働状況・接続数
  • キューのメッセージ状況・コミット状態・各種権限
  • チャネルの稼働状況・ メッセージ状況・送受信サイズ
  • キュー接続中アプリケーションのキュー名・チャネル名

    など

TPモニタ
マネージャ
uCosminexus OpenTP1
  • RPCコール回数
  • RPCコールの応答時間
  • スケジュール要求回数
  • バッファ不足によるスケジュール
  • 失敗情報
  • コミット/ロールバック回数
  • UAPプロセス数
  • UAP異常終了回数
  • DAMread/write回数
  • TAMread/write回数
  • 共用メモリー使用状況
  • ロック待ち時間
  • ジャーナルバッファ空き待ち回数

    など

ERP SAP® ERP
  • SAPメモリー使用率
  • バッファヒット率
  • ディスパッチャー使用率
  • ダイアログの処理効率
  • スプールの使用率
  • レスポンスタイム(DB⇔AP)
  • レスポンスタイム(エンドユーザー)
  • ユーザーリクエスト処理時間
  • ダイアログ ステップ処理時間
  • オブジェクトロード処理時間
  • ディスパッチャー処理時間
  • データベースリクエスト時間
  • システムログ/CCMSアラート

    など

業務システム JP1/Automatic Job Management System 3
  • 実行開始・実行終了ジョブ・ジョブネット数(異常・正常など)
  • 遅延ジョブネット数
  • サブミットジョブ数・通知 済みイベントジョブ数
  • ジョブの滞留数・最大滞留時間・平均滞留時間
  • ISAMデータベースのキーファイル・ データファイルの未使用領域率・サイズ、フラグメント率
  • データベース合計サイズ
  • 組み込みDBの満杯ページ数
  • 使用中ページ数
  • RDエリアの未使用セグメント率・サイズ
  • 一時ファイル用ディレクトリの使用・ 未使用領域サイズ

    など

サービス HTTP、HTTPS、SMTP、POP3、IMAP4、 DNS、DHCP、FTP、TCP、 Webトランザクション、ユーザー定義サービス
  • 総応答時間
  • セットアップ時間
  • 転送時間
  • サービス稼働率

    など

*
監視対象によって、監視できる項目が異なります。
  • ※ エージェントレスで監視する場合は監視対象、監視項目が異なります。

監視サーバ統合と監視範囲分離の両立

クラウド環境での監視運用

クラウド環境など監視サーバを1台に集約して複数の企業・部門(テナント)の監視運用を行う場合でも、各テナントの運用は従来通り、テナントごとに分かれていることが求められます。これを実現するためには、各テナントが相互に情報を参照できないように制御し、それぞれのシステムの独立性、セキュリティを保持することが重要です。JP1では、各テナントの管理者は自分の管理範囲のサービスやシステムのみを管理(設定または参照)できるようにし、他のテナントは管理できないように制限できます。
たとえば、データセンターで複数の企業(テナント)のサービスレベル管理やシステム管理を行う場合、データセンターの管理者はすべてのテナントを管理できますが、各テナントの管理者は自社の範囲だけ管理できて他のテナントの情報は設定・参照できない、という運用が可能です。これにより、テナント間の情報混在防止、テナントの独立性、セキュリティを保持しながら、効率良く管理できます。

クラウド環境での監視運用イメージ