ページの本文へ

Hitachi

企業情報研究開発

近年、HDDよりデータアクセスが高速で処理スピードの速いフラッシュストレージへの関心が高まってきています。しかし、従来型のSSDは、HDDよりもコストが高く、信頼性の面においても課題がありました。そこで日立製作所は、フラッシュストレージの自製化を決意。「低コスト・高性能・高信頼」を兼ね備えたフラッシュストレージ技術についてお話を伺います。

(2013年11月6日 公開)

フラッシュストレージへの期待と日立の戦略

ストレージシステムの記憶媒体としてフラッシュストレージが注目されていますね。

写真「小関 英通(こせき ひでゆき)」

小関はい。近年、エンタープライズ向けのストレージシステムには、主にデータの信頼性と高速応答性の二つが求められています。しかし、HDDを使ったストレージシステムで処理を高速化するためには、数百から数千台のHDDが必要となります。ストレージシステムは、多数のHDDを制御するコントローラを備えていますが、HDDは単体の性能が低いため、ストレージコントローラの性能を限界まで引き出すことは容易ではありませんでした。

そこで、HDDの性能限界を打破する新しいデバイスとして、フラッシュメモリを搭載したSSDが注目されているのです。SSDなどのフラッシュストレージは、HDDに対して百倍から千倍以上の性能を出すことができます。フラッシュストレージを搭載することで、数千台必要だったHDDの台数を百分の一に減らすことができます。

フラッシュストレージはHDDより割高なイメージがあるのですが。

小関確かに単体で見るとフラッシュストレージは割高です。しかし、数百から数千台ものHDDを搭載したストレージシステムを購入する場合と、数台のフラッシュストレージを搭載したシステムを購入する場合に、どちらが得になるかはお客様の性能要件によって変わります。

フラッシュストレージには、お客様にとって導入コストの削減や、これまでHDDを数千台並べていた設置領域の縮小というメリットがあると考えています。

フラッシュストレージを独自に開発しようとしたきっかけは何でしょうか。

写真「鈴木 彬史(すずき あきふみ)」

鈴木性能・信頼性・価格において、いままでのSSDにない新たな価値をお客様に提供したいという思いが開発のきっかけです。

一般に、SSDはさまざまな用途に使えるようにやや割高な設計がされています。これに対し、日立には、これまでの長年のストレージ装置の開発で得た、実際のストレージの利用状況に関する知見があります。こうした知見を利用して装置の信頼性を設計することで、他社よりもコスト競争力に優れる製品設計ができるのではないかという考えがありました。

Hitachi Accelerated Flashの特長

フラッシュストレージ技術を製品化したHitachi Accelerated Flashには、どのような特長がありますか。

写真「小関 英通(こせき ひでゆき)」

小関Hitachi Accelerated Flash(以下、HAF)は、日立が独自開発したフラッシュメモリコントローラを搭載することで、ビットコストの低減と大容量・高速性・高信頼性をともに実現したフラッシュモジュールです。現在は、エンタープライズ向けディスクストレージシステムであるHitachi Virtual Storage Platform(以下、VSP)と、Hitachi Unified Storage VM(以下、HUS VM)の記憶デバイスとして搭載されています。

HAFの大きな特長として、ストレージ装置のコントローラとHAFを日立で一貫して製造していることが挙げられます。これによって、上位のストレージコントローラと連携した新たな機能を提供することが可能になっています。そこは他社のベンダにまねできない日立の大きな強みだと思っています。

写真1 Hitachi Accelerated Flashの写真
Hitachi Accelerated Flash(HAF)の写真

どのように低価格化を実現したのでしょうか。

写真「鈴木 彬史(すずき あきふみ)」

鈴木SSDに使われてきたフラッシュメモリのデバイスには、高価だけれど信頼性や性能の高いSLC(Single Level Cell)というデバイスと、低価格で容量密度の高いMLC(Multi Level Cell)というデバイスがあります。従来のエンタープライズ向けストレージシステムではSLCを採用していたため、必然的にコストが上がっていました。日立は、あえてMLCを使うことでSSDの2倍の大容量化と低価格化を実現しています。

小関さらにHAFは、一般的なHDDやSSDの2倍以上の大きさのパッケージに、低価格なフラッシュメモリを大量に搭載することで、フラッシュメモリ以外のハードの搭載量を最小限に抑えました。

高性能を維持し続けるために

処理性能を上げるために、どのような工夫を行ったのでしょうか。

写真「小関 英通(こせき ひでゆき)」

小関主なポイントは2点あります。1点目は、HAF自体の高速化です。一般的なSSDと比較してフラッシュメモリを2倍から4倍搭載し、大量のフラッシュメモリを並列に動作させることでシステムとして高性能を実現しています。

2点目は、上位のストレージコントローラと連携したフォーマットデータ圧縮機能です。フラッシュメモリを使ったデバイスは、HDDと物理的に違う点があります。HDDは、データを直接上書きすることができますが、フラッシュメモリは上書きすることができません。そのため、データ格納領域のほかに予備領域を設け、新たなデータを一時的に格納するのですが、予備領域が枯渇してくると、新たな領域を確保するためのデータコピー処理が必要となるのです。予備領域の比率が少ないと、このコピー処理が頻繁に行われ、性能が低下してしまいます。事前に予備領域の比率を大きく取ることで、このコピー処理を極力発生させないようにすることを狙った機能が、フォーマットデータ圧縮機能です。

フォーマットデータ圧縮機能について詳しく教えてください。

小関一般的にストレージ装置が最初にSSDやHAFなどのデバイスを使用する際、上位のストレージコントローラは、デバイスを初期化するためにフォーマットデータを格納します。その後運用が始まると、フォーマットデータはお客様のデータに上書きされていきます。つまり、最初のうちは、お客様のデータが実際に格納されている容量は少ないにもかかわらず、フォーマットデータが存在するために、予備領域は一定の容量しか使用できません。そこで日立は、フォーマットデータがHAFに格納される時点で、フォーマットデータをぐっと圧縮し、予備領域の比率を拡大しました。

これにより、徐々にデータ量が増えていくようなストレージの使い方において、HAFは大きな予備領域を確保できるので、性能の低下を最小限にとどめる事ができます。言い換えると、性能が低下しにくく、高性能を維持し続けられる作りになっています。上位コントローラを日立が開発しているからこそ、実現できた機能だといえます。

図1 フォーマットデータ圧縮機能サポート時の性能比較
フォーマットデータ圧縮機能サポート時の性能比較

性能設計をする中でどのような点で苦労しましたか。

小関フラッシュメモリに対するデータの読み書き…我々はリードI/OとかライトI/Oとか呼んでいるのですが、これをどのように最適に制御していくかというのが非常に苦心したところです。

HAFのコントローラは、上位のストレージコントローラからのI/O要求(以下、上位I/O)と、予備領域確保のためのデータコピーを並行処理しています。そのため、高性能を実現するには、上位I/Oとデータコピーのバランスを最適化する必要があります。例えば、上位I/Oを優先させすぎると、一時的に高性能を実現できますが、最終的に予備領域が枯渇し、上位I/Oが継続できなくなります。反対に、データコピーを優先させすぎると、予備領域の枯渇は回避できるものの、上位I/Oがデータコピーに待たされやすくなるため、性能の悪化を招きます。

フラッシュメモリ内部の動作を想像して、「このように制御すれば性能が出るはずだ」という見積もりモデルを立てるのですが、そのモデルが正しいかどうかは、製品のプロトタイプが完成した後に性能を測定するまでわかりません。製品が完成して、最終的な目標性能を達成できたことを確認するまでは非常に心配でした。

上位コントローラとの連携でデータの消失を防ぐ

フラッシュメモリには信頼性の面でどのような課題がありましたか。

鈴木フラッシュメモリは、電源供給を行わない状態でも書き込まれたデータが消えない不揮発性メモリなのですが、時間がたつとデータの正確性が失われていくという特性があります。また、フラッシュメモリの欠点として、書き込み時のビット故障の発生が比較的多いという点があります。

そこで、HAFの内部で定期的にデータのチェックを行い、フラッシュメモリ上で発生しているビット故障率を測定し、問題が進行する前に別領域にデータをコピーすれば、データを長く保存できると考えました。これが「オンラインデータリフレッシュ機能」です。

元々フラッシュメモリは、ビット故障が起きても訂正できるように、訂正符号によってデータを訂正しています。訂正符号で訂正できなくなったときに、データが消失します。オンラインデータリフレッシュ機能は、データを訂正できるうちにデータを読み出して、データを訂正して書き直します。

さらに、HAFにはVSPやHUS VMと連携したデータ回復機能も備わっています。VSPやHUS VMがHAFから定期的にデータチェック結果を吸い上げ、読み出しできない部分についてはほかのフラッシュモジュールからデータを集めて回復することができます。

図2 定期データ診断・回復機能による高信頼化
定期データ診断・回復機能による高信頼化

鈴木オンラインデータリフレッシュ機能で問題になるのは、電気が通電されていないとリフレッシュできないという点です。電気が切られていると、監視もできないし、データをコピーする処理もできない。そのため、どの位の間隔でどの程度通電されていない状態となるかを想定して、お客様のデータを失うことがないよう、最適なリフレッシュ間隔を決めています。フラッシュメモリには品質にばらつきがあるので、どのようにばらついているかも定量化して、統計的に計算して設計しています。

最適なリフレッシュの間隔を模索する中で難しかったことは何でしょうか。

写真「鈴木 彬史(すずき あきふみ)」

鈴木利用条件によってデータの壊れ方がどのように異なるのか予測しなければならない点です。フラッシュメモリは書き換え回数に制限があるのですが、書き換える間隔にも依存します。頻繁に書き換えを行うとデータが壊れやすくなります。こうした書き換え頻度について、実際の利用条件を再現するには、年単位の期間が必要となります。

しかし、実際にそのような時間は確保できないので、短期的な実験から特性やモデルを導き出して、そこから長期的にどのように劣化するのかを推定しなければなりません。そこが難しかったところです。

お客様の立場に立ってさらなる性能向上をめざす

今後、フラッシュストレージはどのような方向へ進んでいくと思いますか。

写真「小関 英通(こせき ひでゆき)」

小関さらなる高性能化が進んでいくと思っています。性能のトレンドを見ているのですが、フラッシュデバイスは、ものすごいスピードで高性能化が図られています。日立のストレージの特長は、性能と信頼性です。わたしは性能設計の担当ですので、やはり性能面で他社に負けたくない。どうすれば高性能化が図れるか、というところを今後の研究課題として持っていきたいです。

もう一つ、性能と信頼性は相反するトレードオフの関係にあります。エンタープライズ向けの製品である以上、信頼性は保てて当然で、その上で高性能なデバイスをお客様は求められています。それに対して、信頼性を保つためのリフレッシュを頻繁に行ってしまうと、リソースを食いつぶしてしまいます。

高性能と高信頼をどのように両立していくかが、今後の研究の難しいところだと思っています。

性能と信頼性、両者のバランスを取っていくことが大事なのですね。

写真「鈴木 彬史(すずき あきふみ)」

鈴木そうですね。性能と信頼性のトレードオフの最適点は、用途によって変わりますので、お客様の使い方に応じたチューニングを検討していきたいと思っています。例えば、キャッシュとしてフラッシュメモリを使用するなど用途が限られているのであれば、性能を優先したチューニングが可能になります。

信頼性設計の担当としては、サービスを考えた上で装置の信頼性設計をやっていきたいという気持ちがあります。ストレージの外で、実際にお客様がどのようなアプリケーションを使ってSSDを利用されるのか、というところまで考えて信頼性設計をしたいと思っています。

小関設計者としては、ストレージベンダが決めたカタログスペック、要するに「想定した環境でこれだけの性能を出す」ということを追いかけがちなのですが、実際にお客様が使われる環境は想定どおりではありません。実際にフィールドに出てお客様の要望を吸い上げることで、将来的に、お客様の立場でどのような性能設計をしていかなければならないか、というところまで知見を広げていきたいと思っています。

特記事項

  • 2013年11月6日 公開
  • 所属、役職は公開当時のものです。
  • ページの先頭へ

類似キーワードコンテンツ

  • ページの先頭へ