ページの本文へ

Hitachi

企業情報研究開発

写真「根本 潤(ねもと じゅん)」
根本 潤(ねもと じゅん)
研究員

非構造化データの増大に伴い、データの保管・管理のインフラとして注目が集まるNAS(Network Attached Storage)。導入の手軽さから普及が進む一方で、組織内にNASが乱立する「サイロ化」が課題となっています。

そこで日立では、NASの抱える課題の解決策として「Cloud on-Ramp」をコンセプトに製品を開発。NASを「クラウドへの入口」として活用するという新しい考え方で、NASの可能性を広げていきます。

(2012年2月16日 公開)

Cloud on-Rampとは

聞き慣れない言葉ですが、「Cloud on-Ramp」とは何なのでしょうか。

根本日本語にすると「クラウドへの入口」という意味になります。つまり、NASをクラウドへの入口にする、という考え方です。具体的には、各拠点や部署にあるNASに保存されたデータをクラウドストレージに集約し、管理することを指しています。

クラウドとNASをうまく組み合わせて、データを効率よく利用できるようにする仕組みが、Cloud on-Ramp機能だと考えていただければよいと思います。

図1 Cloud on-Ramp機能のイメージ
Cloud on-Rampのイメージ

このような機能は、どのような経緯で生まれたのでしょうか。

写真「根本 潤(ねもと じゅん)」

根本NASの普及が進み、さまざまなNASが登場する中、日立としては「他社との差別化」が必要になりました。従来のNASにはなかった形で、お客様のニーズに合った製品を作りたい。お客様が求めているものは何なのか・・・と考えたときに着目したのが、NASの「サイロ化」という課題の解決です。

NASには、ほかのストレージ製品に比べると簡単に導入できるというメリットがあります。ネットワークにつないですぐに使えるという手軽さから、小さい単位だと部単位や課単位で導入しているところもあるようです。しかし、大きい組織の中で、部単位や課単位といった小さい単位でNASを導入していくと、NASが乱立してしまい、容量監視やバックアップといった管理業務の負担が大きくなってしまいます。このような状態を「サイロ化」というのですが、この解決策として「クラウド」を利用することを思いついたのが始まりです。

クラウドにはさまざまな特長がありますが、その中に、必要なときに必要な分だけストレージ容量を確保できる、という容量の柔軟性があります。この特長を利用することで、面倒な管理業務からシステム管理者を解放することができると考えたのです。

図2 NASのサイロ化
NASのサイロ化と問題点。拠点/部門ごとにバックアップを管理しなければならないため、運用管理コストが増大。

運用管理の負担を減らす

Cloud on-Ramp機能ではどのようなことを実現しているのでしょうか。

写真「根本 潤(ねもと じゅん)」

根本Cloud on-Ramp機能の大きな特徴は、バックアップと容量の管理にかかるシステム管理者の負担を軽減していることです。

従来はNASごとにバックアップ作業を実施していましたが、クラウドストレージと連携する設定をするだけで自動的にクラウドストレージ上にバックアップが取られるようにしました。

また、データの利用頻度に応じて、NASが自動的にデータの格納先を決定する仕組みを作ったことで、拠点ごとの容量管理を簡素化しています。使わなくなったデータをNASからクラウドストレージに移動させてしまい、NAS上には「このデータはクラウド上にある」という情報だけを残しておくのです。データを移動させるタイミングは、NASの容量の状態を見て、システムが自動的に判断しているので、システム管理者はNASの容量をあまり意識しなくてもよくなります。さらに、ファイル仮想化技術によって、NASからクラウド上のバックアップデータにもアクセスできるようにしているので、格納先が変わってもユーザは何も意識しなくても大丈夫です。

図3 仮想化技術を利用した階層化
仮想化技術を利用した階層化のイメージ

バックアップだけでなく、リストアにも工夫があるそうですね。

根本リストアに関しては、「オンデマンドリストア」という機能を提供しています。その名のとおり、ユーザが欲しいと思ったデータから順次リストアをする機能です。

従来の方式では、すべてのデータを復元してからでないとサービスを再開できませんでした。しかし、オンデマンドリストアでは、最上位のディレクトリだけを復元した時点でサービスを再開できます。最初に復元するのは最上位のディレクトリだけですが、ファイル仮想化技術を使うことで、ディレクトリ内に実データがなくても、一見するとすべてのデータが復元されているように見せることができるからです。さらに、各データには今までどおり、アクセスもできます。そして、アクセスがあったファイルについては順次リストアします。最初にリストアする範囲を狭くすることでサービス再開までの時間を短縮したわけです。

このような機能を実現できたのは、バックアップデータの形式を検討する際、「迅速なリストアが必要になるだろう」ということも考えておいたからなんです。せっかくのバックアップデータを、必要なときにすぐに利用できないのではもったいないですからね。近ごろ、災害時にいかに早くサービスを再開できるか、という点に注目が集まっています。その点でも、オンデマンドリストアは役立つ機能だと思います。

図4 オンデマンドリストアのイメージ
オンデマンドリストアのイメージ。ユーザのアクセス要求に応じて必要なファイルを高速にリストアする。

バックアップの速さを求めて

開発時に特に苦労されたのは、どのような点でしょうか。

根本Cloud on-Ramp機能の開発では、バックアップの高速化に重点を置いて開発しました。バックアップは、単に自動的にできるだけではなく、いかに速くできるか、という点も重要ですからね。ですが、なかなか思ったとおりの性能が出なくて苦労しました。

どのようにしてバックアップの高速化を実現したのですか。

根本まず、バックアップの対象範囲を検討しました。従来の方式だと、NASにあるすべての情報、つまりディレクトリのツリー構造やメタデータなど大量のデータをバックアップしていました。しかし、この方式だと、すべてのディレクトリを上から下までチェックしながらバックアップすることになるので非常に時間が掛かってしまいます。そこで、更新があったファイルやディレクトリの構成だけをバックアップする方式にしました。更新したデータだけを対象にしたことで、バックアップの速度はだいぶ速くなりました。

図5 自動バックアップの高速化
自動バックアップの高速化。更新のあったファイルやディレクトリを効率的に自動バックアップ。

根本しかし、それだけでは十分な速度は得られませんでした。そこで、次にバックアップデータの「持ち方」を検討しました。

クラウドストレージでは、「ファイル」という単位ではなく、「オブジェクト」という単位でデータを格納します。オブジェクトの中身は、いろいろな形にできるので、最適な格納の方式を検討する必要があります。どの情報までを一つのオブジェクトにするか、というのが非常に悩ましく、さまざまな方式で試して、その特質を評価しました。短時間での開発が求められていたので、手元にある情報だけで各方式の性能を机上で計算し、それとほぼ同時進行でプロトタイプを作って性能を測ってみる、という感じで開発していったので大変でしたね。

お客様からのうれしい声

Cloud on-Ramp機能に対するお客様の反応はいかがでしょうか。

根本Cloud on-Ramp機能をもった製品として「Hitachi Virtual File Platform*」をリリースしているのですが、海外で非常に好評をいただいていると伺っています。海外の販社によると、「ファンが付いている」と。このような評価をいただけたのは、他社との差別化を意識して開発したことが大きいのではないかな、と思います。

*
海外版の製品名は「Hitachi Data Ingestor」

開発に携わられた甲斐がありますね。

写真「根本 潤(ねもと じゅん)」

根本そうですね。営業の方からも「とがった製品ができた」との評価をいただいています。他社と同じような機能ではなく、特徴的な機能を持った製品ができたので、お客様に対してアピールしやすくなったのではないでしょうか。

また、今回の開発を通して、実現したい機能のことだけでなく、関係する機能や、必要になる機能を見据えて開発することの大切さを感じました。自動バックアップでは、表裏一体の機能になっている「リストア」のことを踏まえながらバックアップの単位や方式を検討したことで、「オンデマンドリストア」という機能も実現できました。 また、「アクセスがあったときに必要なデータを持ってくる」という機能は、リストアだけでなく、既設のNASからHitachi Virtual File Platformへのデータ移行にも生かされています。一つの技術から、いろいろなサービスを展開できるようになっているわけですね。

データのさらなる活用に向けて

今後、NASはどのような機能を求められるのでしょうか。

写真「根本 潤(ねもと じゅん)」

根本現時点では、データをクラウド上にためているだけですが、これからはクラウドにためたデータをどのように活用していくかが重要になります。現在、クラウドにためたデータを使って有益な情報を得られないか、という検討が進んでいます。例えば、各支店の売り上げデータを蓄積している場合、そのデータを分析して各支店の営業方法を見直す。そんな経営の意思決定を助けるようなデータの活用方法が考えられます。

このような流れの中でNASに求められることは、いかに速く目的のデータを抽出できるか、という点だと考えています。特に、ファイルそのもののデータの抽出ではなく、メタデータの抽出に着目しています。

メタデータをどのように活用できるかは未知数ですが、さまざまな種類の情報の中から目的のものを速く取り出せるようにすれば、クラウド上のデータの活用に一役買えるのではないかと考えています。

これからもさらなる検討と開発に携わられていくのですね。

根本そうですね。これまで、NASの中でも、アプリケーションや運用管理など、さまざまな分野を担当してきました。今後はこれまでの経験を生かして、お客様が求めるストレージをトータルで考えられる研究者をめざしたいと考えています。

また、さまざまな分野に携わってきて感じるのは、アイデアとして考えたことを一つ一つ評価して、定量的に示していくということは、とても重要だということです。Cloud on-Ramp機能の研究開発でもそうだったように、アイデアをプロトタイピングして証明する、というのは、研究者としてあるべき姿だと考えています。学生時代の研究とは違い、いろいろなプレッシャーもあって大変ですが、「作る」ということは結構好きなので、「研究者としてあるべき姿」を意識しながら、これからも頑張っていきたいです。

特記事項

  • 2012年2月16日 公開
  • 所属、役職は公開当時のものです。
  • ページの先頭へ

類似キーワードコンテンツ

  • ページの先頭へ