ページの本文へ

Hitachi

ビッグデータ×AI(人工知能)

ビッグデータ時代に求められるフラッシュストレージの要件

ビッグデータ時代を迎え、企業内で扱うデータはますます多様な領域に広がり、なおかつ容量が増大しています。
新たなデータ処理要件を満たす上で、従来のハードディスク(HDD)を主体としたストレージは、性能面からボトルネックになりつつあると言えます。

そうした中で存在感を高めているのがフラッシュストレージです。高速回転する磁気ディスクや磁気ヘッドの移動といった物理構造に頼らないNANDフラッシュメモリを採用したフラッシュストレージの可能性について紹介します。

ビッグデータ利活用の進展とともに多様化・高度化するデータ処理要件

情報は、ヒト、モノ、カネとともに経営の4大資源とされており、データを分析することでビジネスの競争優位を獲得しようという考え方は古くから存在します。そして現在、データを生み出すソースは、従来のような基幹系業務システムからだけではなく、ソーシャルメディアで交わされる“つぶやき”やブログ、Webサイトのアクセス履歴といった人の活動、さらには各種センサーや計器などのマシン領域にまで広がっています。

これまで見過ごされてきたデータ、あるいは捨て去られてきた多様なデータを蓄積し、高度な分析を行うことで、ビジネスや生活に役立てていく。さらには、新しい知見や洞察(気づき)を導き出し、企業や社会にイノベーションをもたらしていく。
こうしたことがビッグデータの利活用によって可能になります。

そのためには、大量のトランザクションデータはもとより、顧客情報、営業情報、ソーシャルメディアから収集した消費者のコメント、スマートデバイスから収集した位置情報といった多様なデータを一貫して処理し、相互に紐づけながら複合的な検索や分析、マイニングなどを実践できるITプラットフォームが求められます。

また、クレジットカードの決済情報をリアルタイムに監視した不正利用の素早い検出、あらかじめ設定しておいたKPI(Key Performance Indicators:主要評価指標)のパターンが出現した瞬間に自動で注文を出す株式証券のアルゴリズム取引への活用など、リアルタイムな分析もITプラットフォームへ求められる要件と言えるでしょう。

取り残されたストレージ。高速化によってシステム性能の劇的な向上も

こうした要求に応えられるようIT ベンダー各社はシステムの最適化を進めていますが、ITインフラを見渡したとき、ボトルネックになっているのがストレージです。

サーバーのCPUは、いわゆる「ムーアの法則」に基づいてプロセス技術の革新を進め、トランジスタの集積度を増し、性能向上を続けています。ネットワークの高速化も進んでおり、スイッチはもちろん各ベンダーから出荷されるサーバーのNIC(Network Interface Card:ネットワークインタフェースカード)のほとんどが10GbE(Gigabit Ethernet:ギガビットイーサネット)対応を完了し、さらには40GbEへの対応を進めています。

その一方で、停滞感が見えるのがストレージです。急速な勢いで大容量化と低価格化は進んでいるものの、HDDの回転数はここ10年間で15, 000回転以上には伸びておらず、I/O(システムの入出力)性能は横ばいが続いています(図1)。


図1:CPU性能推移とI/Oの性能推移

これをカバーするため、特に高いI/O 性能が要求されるシステムでは、複数のストレージ筐体を導入し、大量のドライブで並列処理を行っている状況です。ハードウェアコストがどんどん膨らんでいくのはもちろん、メンテナンスコストや電力コスト、データセンターの設置スペース費の増大といった観点からも、企業にとって大きな負担となっています。

I/O性能向上とともにTCO削減でも効果をもたらすフラッシュストレージ

そうした中で注目されているのが、NANDフラッシュメモリを採用してアレイ化(複数のハードディスクをまとめて一台のディスクのように扱う)したフラッシュストレージです。

データのランダムアクセスに際して、常にヘッドの移動をともなうHDDでは構造上どうしてもI/O 遅延が発生してしまいます。半導体であるフラッシュメモリではこうした動作上の無駄がなく、高速なI/O性能を実現できます。業界最高クラスのフラッシュストレージでは、最大100万IOPSという高性能を実現している機種もあります。

このように非常に大きなメリットを生み出すフラッシュストレージですが、これまではコストの観点から、導入に二の足を踏む企業が少なくありませんでした。同じ容量あたりのコスト(ビット単価)で比べると、フラッシュストレージはどうしてもHDDよりも割高になってしまうからです。

しかし、こうしたコストの判断は見方次第で大きく変わってきます。近年、フラッシュストレージのコスト議論でよく言われる指標に性能あたりのコスト($/IOPS)があります。フラッシュストレージは確かにビット単価ではHDDより高くなりますが、性能あたりのコストではむしろ安くなるというものです。加えてフラッシュストレージは、その高速なI/O 性能をより省スペースな環境で確保できます。

さらに、フラッシュストレージは省電力性にも優れています。 先に述べたようなI/Oの並列処理のために大量導入せざるをえなかったHDDのドライブ削減との相乗効果によって、大幅な電力コストやメンテナンスコストを削減できます。

こうした運用コストの削減効果を考慮すれば、フラッシュストレージへの投資は十分に「元がとれる」と言えます。

データの多様化に柔軟に対応しビジネス戦略に即したデータ活用を推進

さらに、フラッシュストレージが高い価値をもたらすのが、将来的なデータ処理形態の変化に対する柔軟な対応力です。

冒頭で述べたビッグデータ利活用の動向からも言えるように、今後自社のITシステムでどんなタイプのデータを扱うようになるのか、それらのデータの容量はどれくらいまで拡大していくのか、まったく予測のつかないところがあります。

これまでの基幹系データベースのように、形式の決まったデータを、特定の目的に沿った形でパフォーマンスを最大化すべく、設計や設定、チューニングを施すといった対応ではとても追いつきません。また、そうした作業負荷がネックになって、新たなビジネス戦略に対応したデータ活用が進まないとなれば、今後の企業の競争力にも大きな影響を及ぼしてしまいます。

日立ではコスト面やデータ処理形態への対応として、高性能用途のオールフラッシュストレージ、フラッシュドライブとHDDを混在させて利用するハイブリットストレージを提供しています(図2)。


図2:フラッシュストレージの利用形態

さらに、フラッシュドライブには日立で独自開発した「Hitachi Accelerated Flash」を使用しています。フラッシュメモリをエンタープライズクラスのストレージに適用するために、スケーラビリティ、高信頼性、コストパフォーマンスを改善しています(図3)。


図3:フラッシュドライブのポジショニング

業務の効率化やコスト削減に加え、新たな事業の創造、グローバル化へと広がっている今後の経営課題に応えていかなければならないITシステムにとって、可能な限りシンプルにスリム化されたインフラのもと、全体最適化されたサービスを提供していくことがますます重要となります。

OLTP(オンライントランザクション処理)やバッチ処理、さらにはタイプの異なるデータ同士の複合的な分析まで、あらゆるデータ処理形態に対して高いI/O性能をシンプルな形で提供できるフラッシュストレージは、画期的なソリューションを生み出す源泉となります。

特記事項

  • この記事は、「会報誌 HITACHI USER 2014年1月」に掲載されたものです。
  • 記載の会社名、製品名はそれぞれの会社の商標もしくは登録商標です。