本文へジャンプ

ミドルウェア

uVALUE 実業×IT

Hitachi

*
株式会社リクルートキーマンズネット(新規ウィンドウを開く)に2008年12月16日に掲載された記事より転載掲載しています。
サービス内容、料金などは、掲載日または更新日時点のものです。
JP1による「稼働監視」こそ仮想化成功の鍵

2008年11月17日、六本木ヒルズにて「HITACHI Open Middleware World 2008 Autumn JP1 Day」が開催された。
<JP1が成功に導く、実践!仮想化&グリーンIT>というテーマでセミナーや講演、展示などが行われ、会場は多くの人でにぎわっていた。この分野に寄せる人々の期待の大きさの表れだと感じられた。

このように、注目を集めているサーバの仮想化だが、実は「仮想環境を使いこなす」という点は依然として大きな課題だ。その解決策となるのが、 “JP1”を用いた稼働監視。今回は、本セミナーの中から「仮想環境の課題がどのように解決されるか」を分かりやすく紹介したセッション『仮想環境を最大限に使いこなす稼働監視と最適なチューニング』の要点をお伝えしよう。


実際にセミナーにて上映され分かりやすいと好評だったFlashムービー、JP1による稼働監視のケーススタディも今回、ダイジェスト版で掲載する。具体的にJP1の画面を見ることで、課題への理解や解決策も、より深まるはずだ。ではまず、「仮想化の課題」の解説から見ていこう。
「サーバの集約によるメリットを一言でいうと、リソースの有効活用による運用コストの削減です」
日立製作所ソフトウェア事業部第1JP1設計部の尾関嘉一郎氏はこう語る。簡単な例で説明すると、下図のように稼働時間が「昼がピーク」のサーバと、「夜がピーク」の合計2台の物理サーバを仮想化し、1台の物理サーバに集約してしまえば、サーバ台数が減り、運用コストだけでなく、電力や空調面でも省電力に効果的というわけだ。
日立製作所
ソフトウェア事業部
第1JP1設計部
尾関 嘉一郎氏
しかし、稼働監視においては、今までの物理環境では起こらなかった、仮想環境特有の現象が発生する。
「だからこそ、仮想環境を考えた稼働監視が重要になるのです。さらに、リソースの共有によって複数の仮想マシンが相互に影響し合うことも難しさの1つ」と、尾関氏は解説する。

では、稼働監視の基本となる、CPUとメモリの使用率を考えてみよう。
まず、CPU使用率だ。仮想環境では、CPU使用率は仮想マシンの負荷状況に応じて動的に割り振られる。そのため、仮想マシン上のOSでCPU使用率が常に100%使用であっても、他の仮想マシンの負荷状況によっては、割り当てられるリソース量が変化する。つまり、OS上からは実際に使用されたリソース量の変化が読み取れないということである。
次にメモリの場合。メモリを複数の仮想マシンで共有することでメモリ利用効率の向上を図れるのは事実。しかし、それぞれの仮想マシンが把握しているメモリ使用率と、実際のメモリ使用率が一致しないということも起こりうる。仮想マシンそれぞれに注目するとメモリ使用率にまだ余裕があるように見えるが、実際の物理メモリにはほとんど空きがないということにもなりかねない。
「そこで、JP1では、物理サーバと仮想環境上のリソース双方の可視化を実現しました。仮想環境の活用を考えた上で“監視”は重要なポイントです(尾関氏)」
では、JP1がどのように監視を行うのか…次の項目のFlashムービーで見てみよう。
このページの先頭へ
仮想・物理両面からの“監視”がJP1でどのように行われるか―具体的なケーススタディとして、A社のシステムを取り上げる。
A社では、「受注管理サーバ」と、「営業管理サーバ」を物理サーバ1台に集約していたが、受注管理サーバのCPU使用率が急に増加し、システムトラブルにもつながりかねない状況。
CPU使用率が急に増加した原因の究明と対処について、JP1での流れを追ってみよう。
セミナーで「分かりやすい」と好評だったムービーをここに掲載する。
このページの先頭へ
JP1による仮想環境の稼働監視についてはお分かりいただけただろうか。
ここでは、PART2で取り上げたJP1の監視についての流れをまとめるとともに、ポイントを整理しよう。
突発的なトラブルに対応するために常時監視。トラブル発生の際には、システム管理者にメールで通知される。
原因究明に必要となる仮想マシンごとの性能状況をレポートで表示。
受注管理サーバのCPU使用率が増加した原因を仮想環境だけでなくOSやミドルウェアの稼働性能からも調査。
原因究明の調査で得られたデータから対処案を検討。
業務の優先度や重要度、リソースの利用状況などを考慮し、対処の方法を検討する。

今回のケーススタディの場合、
 ・受注管理サーバのOracleプロセス増加によってCPU不足が発生している
 ・営業管理サーバは優先度の低い業務をしている
 ・トラブルであり急な対応が迫られている
といった観点から、CPU割当率の変更による受注管理サーバの不足率解消で対処することに決定。
このページの先頭へ
仮想環境でリソースを効率的に活用するには、従来の物理環境とは異なる稼働監視やチューニングが必要となる。そこで、JP1で物理・仮想環境の監視から、対処に至るまでのプロセスを取り上げた。

これを1つのサイクルとしてとらえることが、継続的な仮想環境の活用につながると尾関氏は述べる。

「今回、紹介したのは、突発的な問題に対してのトラブルシュートのサイクルです。より安定したシステム運用を行うためには、このような突発的な問題を減少させるサイクルを考えていかなければなりません--。長期間の監視情報を蓄積し、将来、システムにとって問題となりうる傾向を予測する。つまり、問題の発生前に対策していくキャパシティプランニングのサイクルです。短期間の問題のみならず、長期的にも役立てられるのがJP1の大きな特長です(尾関氏)」

仮想化は、今や導入の是非を問うよりも、“どう運用するか”が重要な時代にさしかかりつつある。その中でも、「仮想環境を考慮した稼働監視」は、忘れてはならない重要な観点だ。
今後、仮想環境を効率的に活用したいと考えるユーザは、JP1による監視の導入をまず、検討してみてはいかがだろう。

トラブルの予兆を検知するアラーム監視、稼働情報からトラブルの原因を読み取りやすくするレポート機能が充実。収集した稼働情報には、原因究明、チューニングに役立つデータが豊富。
長期間の監視で得られた稼働情報やレポート出力の結果などから、今後ボトルネックになりそうな個所を特定。将来的なシステムの性能悪化予防に貢献する。
Adobe Flash Playerのダウンロード
Flash形式のファイルをご覧になるには、Adobe Systems Incorporated(アドビシステムズ社)のAdobe Flash Playerが必要です。