ITシステムがますます多様化・複雑化する中、サーバ上で動作するOSや各種アプリケーションも複雑に連携しています。こうした状況下でシステムダウンが起きると、トラブルの原因を究明し、復旧するまでに多くの時間を要します。ITシステムの安定稼働には、システム上で動作するさまざまな要素を効率良く監視できること、業務がストップする前にトラブルを予測、回避できること、そして、将来に渡って安定的に稼働できるようにすることが重要です。
JP1は、OS、データベース、各種アプリケーション、仮想環境などの稼働情報をシステムとアプリケーションの両面から収集します。これらを一元管理し、横断的に分析することで、問題の特定から解決、さらには将来のキャパシティプランニングまで、安定したシステム運用を支援します。
OS、データベース、各種アプリケーション、仮想環境など、さまざまな監視対象の稼働情報を、統一したインタフェースで収集し一元管理できます。トラブルの予兆を検知するアラーム監視や、収集した稼働情報からトラブルの原因究明・チューニングに役立つレポート機能が充実しています。さらに、長期間の監視で得られた稼働情報やレポート出力の結果などから今後ボトルネックになりそうな箇所を特定でき、キャパシティプランニングにも役立ちます。

監視対象サーバに監視エージェントをインストールする「エージェント監視」と、監視エージェントをインストールせずにリモート監視する「エージェントレス監視」があります。監視項目の充実したエージェント監視と、導入が容易で監視対象サーバに負荷をかけないエージェントレス監視を組み合わせることができるので、監視対象サーバごとの重要度に応じた適切な稼働監視が実現します。
システム構成

危険域や警告域のしきい値に達した際にシステム管理者へ通知する方法や、レポートの表示形式を定義済みテンプレートとして標準提供。
インストール直後からスムーズに運用を開始できます。
クイックガイド画面では豊富な監視項目の一覧を確認でき、操作したいフィールドのアイコンから監視の設定やリアルタイムレポート、履歴レポートを表示できます。
また、レコードやフィールドと説明文が表示されるので、見たい監視項目をワンクリックで表示でき、簡単に操作できます。

監視したい項目のキーワード、たとえば「CPU」「メモリー」「TCP」といった用語から、関連する監視項目を検索できます。さらに、検索結果画面には監視項目(フィールド)の説明が表示されるので、それらを見ながらレポートやアラーム作成時の監視項目を選定できます。

監視対象サーバの数が多い場合にネックとなるのが、各エージェントの設定作業です。JP1なら、複数エージェントに対して一括定義が可能。たとえば、1台のエージェントに対して稼働情報の収集条件を定義すれば、その定義情報をコピーして他のエージェントに配布することができます。
初期導入時の構築作業やエージェントの追加作業が省力化できるだけでなく、設定ミスの削減にもつながります。
システム構成

システム全体のサーバやエージェントの稼働状況、エージェントのアラーム監視状況などを部署やシステムごとにフォルダ分けして、システム情報サマリ監視画面にビジュアルに表示します。
1つの画面でシステム全体の稼働状況を直観的に把握できます。
仮想マシンだけではなく、物理サーバも含めたシステム全体の稼働監視が可能。
その結果、仮想環境での問題の予兆検知はもちろん、物理サーバのリソースを有効活用した仮想環境の構築を支援します。
稼働情報の収集では、「どのサーバの、どの項目の稼働情報を、どのタイミングで取りに行く」といった詳細な設定が可能です。監視・分析に必要なデータだけを収集・蓄積できるため、監視対象のサーバやデータベースに余分な負荷をかけずに効率良く管理できます。
サーバやプロセスの状態はもちろん、監視エージェントのサービス状態をリアルタイムに監視できます。監視エージェントが停止した場合も自動的に再起動するため、監視運用を継続できます。
また、ユーザーアプリケーションや他管理ツールで取得した情報を監視対象として設定できるなど、お客さまのシステムに特化した情報も監視できます。
危険な状態になる前に、システム管理者へのメール通知や外部コマンドを自動実行するアラーム機能を提供。問題発生の未然防止に役立ちます。
システム構成

業務サーバで稼働しているアプリケーションのプロセスやWindows®サービスの死活監視をはじめ、プロセスごとの稼働情報を監視できます。
異常を検知すると、どのアプリケーションのどのプロセスが異常なのかをレポートでリアルタイムに確認できます。
プロセスやWindows®サービスの死活監視をエージェントレスで実現できます。エージェントレス監視は監視対象サーバにエージェントをインストールする必要がないため、稼働中のシステムに対してもすぐに死活監視が始められます。
プロセス監視の定義画面で実際の稼働プロセスやWindows®サービスを確認しながら定義ができます。フィルタリング機能で関連のあるプロセスを絞り込んで表示することもできるので、入力ミスの低減と作業効率の向上につながります。また、プロセスごとに稼働数の上限・下限の設定もできます。
システム構成
HTTP、HTTPS、SMTP、POP3などのインターネット・サービスの応答時間を計測することによって、サービスの利用者に適切なサービスが提供できているかを監視できます。計測条件に従ったリクエストを定期的に送信し、レスポンス時間やスループットを計測できます。
サービス利用者の一連の操作を想定したシナリオを作成し、その応答時間を計測できます。ログインを伴うWebアプリケーションの計測も可能。測定結果をレポート表示すれば、レスポンスが低下する時間帯や傾向を視覚的に確認でき、レスポンス低下の原因分析に役立ちます。
システム構成

稼働情報を蓄積しながら、分、時、日、週、月、年単位で自動集計できます。さらに、集計データの保存期間を指定することで、一定のディスク使用量を保ち、サーバリソースを浪費する心配がありません。
蓄積された稼働情報をもとにシステムの稼働状況の変化を過去の稼働実績データ(基準:ベースライン)と比較して相対的に評価できます。これにより、勘に頼らないキャパシティプランニングを支援します。
稼働状況データのレポートは、チューニングやシステムリソースの増設などの検討に欠かせない資料として利用できます。
期間を指定した差分バックアップによって、稼働情報のバックアップ負荷を軽減。数年分の稼働情報を、監視を止めることなく効率良くバックアップできます。
CSV形式またはHTML形式でレポートを出力できます。これにより、CSV形式で出力して解析用データとして活用したり、HTML形式で出力した稼働状況レポートを社内で参照したりできます。
[ジョブスケジューラ:JP1/Automatic Job Management System 3]を利用すると、毎日、毎週、毎月のレポート出力も自動的に行えます。

あらかじめブックマークに登録した複数のレポートを並べて表示できます(タイリング表示)。
複数のレポートを並べて表示することで、効果的な障害要因の分析やキャパシティプランニングに役立ちます。

レポート作成時にあらかじめドリルダウンの設定をすることで、グラフをクリックするだけで詳細データや関連データを表示できます。特定の期間のデータを詳しく見たい場合や関連するサーバのデータを調査したい場合などに役立ちます。
システム構成
| 種 別 | 監視対象 | 主な監視項目 |
|---|---|---|
| プラットフォーム | Microsoft® Windows Server® 2008、 Microsoft® Windows Server® 2003 |
CPU・メモリー・ディスク使用状況、ディスクアクセス状況、ネットワーク使用状況(IPv4/IPv6)、プロセス単位の詳細情報、プロセス数の上限値・下限値、デバイス情報、サービス情報、イベントログ、Active Directoryのレプリケーションのトラフィック など |
| Solaris、AIX、HP-UX、Linux® |
CPU・メモリー・ディスク使用状況、ディスクアクセス状況、プログラムごとのユーザー稼働状況、プロセス稼働状況、アカウント・プロセス状況、プロセスごとのシステム資源使用状況、プロセス数の上限値・下限値、コンソール・メッセージ、ネットワークデータ転送量および使用状況、ネットワークコリジョン、プロセス・ クライアント・ファイルシステムのアクセス状況 など |
|
| 仮想環境* | VMware® ESX、 VMware® ESXi、 Microsoft® Hyper-V®、 Virtage、KVM |
物理サーバ・仮想マシンごとのCPU使用率および使用量、CPU不足率、CPUの割当上下限値・均衡値、メモリー使用量、スワップI/O、ワーキングセットサイズ、ワーキングセットサイズ率、メモリーの割当上下限値、メモリー未使用量、メモリー割当量、スワップ使用量、ディスクのコマンド破棄率、論理ディスクごとの使用率・使用量、データストアのディスク使用量、ネットワークデータ送受信速度 など |
| データベースサーバ | Oracle® Database |
CPU使用状況、各種メモリー使用状況、I/Oキャッシュ・ヒット率、ソート情報、ネットワークの使用状況、プロセス単位の詳細情報、データベース使用率、テーブル・スペース情報、フラグメンテーション、ロック発生情報、SQL情報、エラー情報、パラメーター情報 など |
| Microsoft® SQL Server |
CPUの使用状況、データベーススペース使用状況、キャッシュヒット率、ネットワークの使用状況、環境設定情報、ロック発生情報、エラー情報 など |
|
| IBM® DB2 |
各種メモリー使用状況、I/Oキャッシュ・ヒット率、ソート情報、SQL情報、エラー情報、構成パラメーター情報 など |
|
| HiRDB |
バッファ情報(実I/O回数、ヒット率など)、ロック資源情報、トランザクション数、ロールバック率、HiRDBプロセス稼働情報、ログ入出力エラー回数、サーバとクライアントのネットワーク制御情報、データベーススペース利用状況、HiRDBファイルシステムスペース利用状況、HiRDBサーバ情報 など |
|
| グループウェア | IBM® Lotus Domino |
エージェント実行情報、ドミノ情報、データベース情報、ICM情報、IMAP情報、LDAP情報、ローカルディスク情報、Notesメール情報、サーバメモリー情報、滞留・Deadメール情報、ネットワーク情報、NNTP情報、データベース複製情報、サーバ情報、ドミノへルスチェック情報、Notesログ情報、Webサーバ情報 など |
| Microsoft® Exchange Server |
キュー・メッセージ、ユーザーログオン、プライベート・パブリック情報、サーバ・システム情報、プロセッサ、メモリー、プロセス、ディスク・ページファイル、ネットワーク、最大送信者・受信者、インターネットメール接続、未使用メールBOX、Exchange固有性能値 など |
|
| Webサーバ | Microsoft® Internet Information Services |
各種接続、ファイル転送、各層別転送率、ASPスループット、帯域制限、ワーキングセット、スレッド、プロセッサ、ディスクパラメーター、NotFoundエラー など |
| Webアプリケーションサーバ | IBM® WebSphere Application Server |
JVMランタイムのメモリー使用率・CPU使用率・ガーベッジコレクション所要時間、動的キャッシュのヒット率、スレッドプールの使用率、JDBC接続プールの使用率、J2C接続プールの使用率、Webアプリケーションのセッション数、サーブレットの平均応答時間、トランザクションのコミット数・ロールバック数、Webサービスの平均応答時間、IBM® WebSphere Application Serverの状態 など |
| Oracle® WebLogic Server |
Javaヒープ使用率・GC回数・GC実行時間、スレッドプールの使用率・キューに滞留中のリクエスト数、コネクションプールの使用率・待ち接続要求数、サーブレットの呼び出し回数・平均実行時間、EJBプール内のインスタンス数・キャッシュヒット率、JMSの格納メッセージ数・保留メッセージ数、トランザクションのコミット数・ロールバック数、BEA WebLogic Server®の稼働状態 など |
|
| uCosminexus Application Server |
Javaヒープ使用率・GC回数、ステートフルセッションBeanのセッション数、ステートレスセッションBeanのインスタンス数、メッセージドリブンBeanの受信メッセージ数、リソースアダプタのコネクションプールの使用状況、トランザクションサービスの処理数、uCosminexus Application Serverの稼働状態 など |
|
| メッセージキューイングシステム | IBM® WebSphere MQ |
キューマネージャーの稼働状況・接続数、キューのメッセージ状況・コミット状態・各種権限、チャネルの稼働状況・メッセージ状況・送受信サイズ、キュー接続中アプリケーションのキュー名・チャネル名 など |
| TPモニタ | uCosminexus OpenTP1 |
RPCコール回数、RPCコールの応答時間、スケジュール要求回数、バッファ不足によるスケジュール失敗情報、コミット・ロールバック回数、UAPプロセス数、UAP異常終了回数、DAMread/write回数、TAMread/write回数、共用メモリー使用状況、ロック待ち時間、ジャーナルバッファ空き待ち回数 など |
| ERP | SAP® ERP |
SAPメモリー使用率、バッファヒット率、ディスパッチャー使用率、ダイアログの処理効率、スプールの使用率、レスポンスタイム(DB⇔AP)、レスポンスタイム(エンドユーザー)、ユーザーリクエスト処理時間、ダイアログステップ処理時間、オブジェクトロード処理時間、ディスパッチャー処理時間、データベースリクエスト時間、システムログ・CCMSアラート など |
| 業務システム | JP1/Automatic Job Management System 3 |
実行開始・実行終了ジョブ・ジョブネット数(異常・正常など)、遅延ジョブネット数、サブミットジョブ数・通知済みイベントジョブ数、ジョブの滞留数・最大滞留時間・平均滞留時間、ISAMデータベースのキーファイル・データファイルの未使用領域率・サイズ、フラグメント率、データベース合計サイズ、組み込みDBの満杯ページ数、使用中ページ数、RDエリアの未使用セグメント率・サイズ、一時ファイル用ディレクトリの使用・ 未使用領域サイズ など |
| サービス | HTTP、HTTPS、SMTP、POP3、IMAP4、 DNS、DHCP、FTP、TCP、IEシナリオ、 Webトランザクション、ユーザー定義サービス |
総応答時間、セットアップ時間、転送時間、サービス稼働率 など |
* 監視対象によって、監視できる項目が異なります。
※ エージェントレスで監視する場合は監視対象、監視項目が異なります。
クラウド環境など監視サーバを1台に集約して複数の企業・部門(テナント)の監視運用を行う場合でも、各テナントの運用は従来通り、テナントごとに分かれていることが求められます。これを実現するためには、各テナントが相互に情報を参照できないように制御し、それぞれのシステムの独立性を保持することが重要です。
JP1では、各テナントの管理者は自分の管理範囲のサービスやシステムのみを管理(設定または参照)できるようにし、他のテナントは管理できないように制限できます。たとえば、データセンターで複数の企業(テナント)のサービスレベル管理やシステム管理を行う場合、データセンターの管理者はすべてのテナントを管理できますが、各テナントの管理者は自社の範囲だけ管理できて他のテナントの情報は設定・参照でない、という運用が可能です。
これにより、テナント間の情報混在を防止できるので、テナントの独立性を保持しながらシステム全体を効率良く管理できます。
