特集記事:HITACHI USER -ITビジネスNavi Vol.8-
「ビッグデータ」は、IT関係の情報サイトなどでその言葉を見ない日 がないほど注目されており、近頃はビッグデータを利用しないと、情報 化社会の中で取り残されるような気もしてくるほどです。
社会にあふれるあらゆる情報「ビッグデータ」を利活用するには、具 体的にどのような環境が必要なのか、最新のプラットフォーム事情を ご紹介します。
ほんの数年前まで、各企業や組織が保有しているデータ量は大き いところでもペタバイト(PB)オーダーと言われていました。しかし、ビッ グデータといわれる情報の爆発的な増大により、今ではその1,000倍 のエクサバイト(EB)も珍しくなく、今後はさらに1,000倍のゼタバイト (ZB)という容量になっていく時代を迎えると言われています。
このビッグデータを利活用することで、次々刻々と変化するビジネ スの状況や社会環境に対応して企業の経営判断や様々なオペレー ションをダイナミックに修正/変更したり、今まで気がつかなかった切り 口でビジネスモデルを見直したりといったことが可能になってきていま す。そして、ビッグデータを利活用するための情報システムとしてクラウ ドがますます注目されています。
日立は、図1に示すようにビッグデータ利活用に向けた三つのステッ プ(収集・蓄積、検索・可視化、分析・予測)があると考えています。それ ぞれのステップにおいて、データの扱い方や処理の仕方が従来と大 きく変わってきますので、各ステップの要件を満たすクラウド構築が必 要です。
図1:ビッグデータ利活用を支援する日立のクラウド
日立では、大量のデータを効率的に保管できる「インフラクラウド」 (収集・蓄積)、さまざまなファイルやコンテンツを蓄積一元管理し簡 単に参照できるようにする「コンテンツクラウド」(検索・可視化)、そし てそれらのファイル、コンテンツをさまざまな切り口で分析したり、別の アプリケーションから簡単に活用できるようにする「インフォメーション クラウド」(分析・予測)という三つのクラウドを提案しています。そし て、これらのクラウドを実現し、お客さまのビッグデータ利活用を支援 するプラットフォーム、ソリューション、サービスを提供していきます。
それぞれのクラウドは目的が異なるため、それらを構成するプラット フォームに求められる要件も異なります。それぞれのクラウドに対する 要件を整理しますと、
などが挙げられます。
これらの要件を満たしつつ、さらに増加し続ける多様なデータ処理 に対応するために、日立は以下のようなアプローチを行います。
まず、プラットフォームの基本性能を高めたストレージプラット フォーム、ファイルコントローラ、サーバプラットフォームを提供しま す。そして、これらのリソースを容易に有効利用するために三つの仮 想化(ストレージ仮想化、ファイル&コンテンツ仮想化、そしてサーバ 仮想化)を提供します。ここでは最新のプラットフォーム製品につい てご紹介します。
インフォメーションクラウドシステムが要求するサーバ仮想化レイヤお よびサーバプラットフォームへの要件には以下のようなものがあります。
図2に示すサーバプラットフォームは、これらの要件を大きく改善する ことができます。
図2:さらに高速なデータ処理を実現するサーバプラットフォーム「BS500」「BS2000」「HA8000シリーズ」
今回新たに製品化したサーバプラットフォームは、最新のIntel Xeon-E5高性能プロセッサを採用しコア数を1.3倍にするとともに、メ モリ用スロット数を4倍に拡張し、さらに広帯域のネットワークアダプタ サポートにより帯域を2.5倍に拡張しました。
特に、モデルBS500では、広帯域のネットワークアダプタの能力を 十分に生かせるよう、一つのポートを仮想的に最大4ポートに分割して 使用することが可能です。
用途ごとに必要な帯域を割り当てることで、リソースを無駄なく使い きることができるようになり、ポートを共有するそれぞれの用途の間で 互いの性能干渉を防ぐことができるので、性能をマネージメントしやす く、期待した性能を得ることが可能になります。
このようなデータ処理の高速化技術により、インフォメーションクラウ ドへシステムを発展させていくために必要となる、サーバプラットフォー ムの性能面の強化が可能となります。
インフォメーションクラウドを支えるサーバ仮想化レイヤを実現 する基幹技術を提供するのがサーバ仮想化機構Virtage(バター ジュ)です。今回のサーバ新製品で採用している最大16コアのIntel Xeon-E5の高性能プロセッサの高い処理能力を仮想化により複数 の仮想サーバに効率よく割り当てることで、CPUリソースの能力を最 大限活用することが可能となります。
さらにVirtageでは、クラスタ機能、N+1の冗長構成などの可用性機 能を備えています。リソースに障害が起こった場合でも、影響を極力抑 えながらサービスを継続し、システムを稼働したまま保守作業を行うこと が可能です。省電力運用にも利用できる大変便利な機能です。
コンテンツクラウドシステム、インフラクラウドシステムが要求するス トレージ仮想化レイヤおよびストレージプラットフォームへの要件には 以下のようなものがあります。
このような要件を満たすストレージインフラ実現に向け日立ユニファ イドストレージコンセプト(図3)を定め、このコンセプトのもと、あらゆる 種類のデータ(DB、メール、映像など)を蓄積するストレージインフラ管 理運用の一元化をめざします。
図3:日立ユニファイドストレージコンセプト
日立ユニファイドストレージコンセプトの実現を支える基盤プラット フォームがHitachi Unified Storage 100( HUS100)です。HUS100は、 ファイル・ブロックの管理一元化を実現したユニファイドストレージです。
長年の実績がある日立ミッドレンジストレージの高信頼アーキテク チャをベースに、容量拡張と高性能化を実現しました。最大容量は従 来比2 倍で、今後の データ量増加にも充 分対応できる拡張性 を確保しました。
また、データ転送性 能を従来比3倍に高 め、大容量化を続ける データでも高速転送 を提供します。
これらの強化によ り、大量データへの高 速アクセスを実現するための、ストレージインフラの容量面・性能面の 強化が可能となります。
一方、ビッグデータ時代では、性能を重視するデータや保管コストを 重視するデータなど、要件の異なる多様なデータが一緒くたにストレー ジに保管されます。性能重視や保管コスト重視といったデータの特性や 要件に応じてデバイスを使い分けることにより、適切なコストで、適切な アクセス性能を実現できます。これをストレージで自動的に行うのがスト レージ階層の仮想化です。ストレージ階層の仮想化をHUSで実現する ことにより、ファイルストレージ・ブロックストレージ共通のストレージプー ルを利用できますので、さらなるリソース効率利用が可能になります。
日立ユニファイドストレージコンセプトでは、HUSのほかにも用途、 環境に応じて各種製品を用意しております。
大量コンテンツの蓄積・高速検索/分析ニーズに応える製品が高性能ファイ ルコントローラ。
高い拡張性と高い重複排除率を両立したファイルストレージ。
優れたファイル重複排除率、導入容易性を装備したバックアップ用途向け ファイルストレージ。
ストレージの稼働状況を日立管理ソフトウェアHitachi Command Suiteの 統合画面で一元的に管理。
日立は、これらのITプラットフォームにより、ZB時代のデータ利活用 を実現する情報システム構築を支援します。