ページの本文へ

Hitachi

企業情報研究開発

病院のカルテや建築物の設計書、証券の取引報告書などといった、長期間保管しておかなくてはならない情報。従来は紙で保管されていたこれらの情報が、どんどんデジタルデータへと変化しています。デジタルデータを長期間かつ低コストで保管し続けたい。そんなニーズに応えるため、日立製作所では長年培った光ディスクの研究を礎に、50年以上にわたって安心してデータを保管できるストレージ製品「ブルーレイディスクアーカイブシステム」を開発しました。

(2014年4月24日 公開)

増大するデジタルデータをアーカイブするために

まず、「アーカイブ」とは何を指しているのでしょうか。

大野アーカイブというのは、データを長期保管することです。近年、このアーカイブのニーズが非常に増加しています。いまは情報をすべてデジタル化していて、従来は紙で長期保管していたような情報が、どんどんデジタルデータに変化しているからです。

図1に示しているように、アーカイブ対象となるデータには業務によってさまざまものがあります。例えば、医療現場のカルテ、建物や機器の設計図などのデータ。また、訴訟の多い北米では企業活動のエビデンスを長期にわたって残しておく必要があり、5年、10年、15年と法律によって保管期間が決められています。

さらに、大学の研究データ、例えばゲノムの解析データなど、一つ一つが大きくて、半永久的に保管しておかなくてはならないデータもあります。 このように、長期保管が必要なデータが増大しているのです。

図1 業務によるデータアーカイブの用途例と保管義務
業務によるデータアーカイブの用途例と法的な保管義務を示した図

データの長期保管と言うと、テープを使うイメージがありますが…

小林そうですね、従来のアーカイブには、主にテープが使われていました。しかし、テープはハードディスクに比べると、とても面倒なものなんです。定期的に巻き戻しが必要だったり、データを読み出すときには早送りして位置を合わせるために時間が掛かったりといった問題があります。

残念なことに、これまではデータをパソコンのハードディスクに保管する以外の手段が、それほど発達していませんでした。参照頻度が高いデータの保管については、ハードディスクは非常に適しています。ですが、アーカイブデータのような参照頻度が低いデータを保管しておくには、高価なハードディスクではコストが掛かりすぎます。テープとハードディスクの両方のメリットを備えたデータの保管手段がなくて、ストレージ製品のラインナップに穴が空いているような感じでした。

大野図2のデータのライフサイクルで示している、参照から破棄にあたるところの製品ですね。このあたりの、参照頻度が低いデータに対して最適な製品はどのようなものか考えたとき、長期保存性に優れており、かつ低コストなものが最適である、というのが我々の解でした。

そして、このような製品を実現するには、コンシューマー用途ですでに広く普及しているブルーレイディスクを利用できるのでは、ということになりました。ブルーレイディスクの寿命は50年以上で、温度変化や水害にも強い。長い期間安心してデータを保管しておける、という大きなメリットがあるからです。

図2 データのライフサイクルとストレージ製品の需要
データのライフサイクルとストレージ製品の需要を示した図

長期保存かつ低コストを実現する仕組み

ブルーレイディスクアーカイブシステムの仕組みを教えてください。

写真「大野 千代(おおの ちよ)」

大野ブルーレイディスクアーカイブシステムは、ブルーレイディスクと光ディスクドライブが収納されている「ライブラリ」が一つの単位になっています。ライブラリにはカートリッジが二つ入っていて、カートリッジ一つにブルーレイディスクが250枚入っています。カートリッジごとスッと抜いて、必要だったらまた差し込んで使うので、250枚のブルーレイディスクを一気に交換できることになりますね。

抜き出したカートリッジは、専用ケースに入れて保管します。いままで書類を棚に並べていた代わりに、このカートリッジが入った専用ケースを並べてもらうようなイメージです。オフラインでデータを保管できるので、システム全体の消費電力を低減できます。

図3 ブルーレイディスクアーカイブシステムの構成
ブルーレイディスクアーカイブシステムの構成図

250枚のブルーレイディスクを一度に交換できるというのは、すごいですね。

大野そうですね。ブルーレイディスクレコーダーなど、いままでのコンシューマー向け製品とは、まったく違う使い方になります。

小林250枚のブルーレイディスクを1枚ずつ手動で交換していたら、オペレーターの人件費だけで大変なコストが掛かります。しかも、データがずっと連続して入ってくるとも限らない。オートメーションで、24時間ディスクを変えながら記録できるというのがこのシステムのアピールポイントです。

大野使い方だけでなく、信頼性の面でも、コンシューマー向けとは差別化を図っています。エンタープライズ向けのアーカイブシステムということで、50年先まで安心してデータを保管できるシステムを実現する必要があります。

そこで我々は、二つの方向から信頼性の向上にアプローチしました。一つ目は、経年劣化による品質低下を防ぐために、データの書き込み方法を長期間の保管に合わせて最適化させること。二つ目は、傷や埃による品質低下を防ぐために、誤り訂正符号によるエラー訂正のレベルを引き上げることです。

経年劣化を遅らせるデータの書き込み

データの書き込み方法の最適化について教えてください。

大野光ディスクの媒体自体は50年以上の寿命がありますが、記録したデータは経年劣化して読み出せなくなります。これを防ぐために、光ディスクにデータを書き込むためのレーザーの出力パワーを最適化させました。

写真「小林 正幸(こばやし まさゆき)

小林品質を向上させるだけでなく、品質のとらえ方を変えたのが、今回の技術の新しいところです。これまでは、データを書き込んだ直後にちょうど良く読めることを目標にしていました。でも、今回の製品では書き込んだデータを50年先でも読めるようにしなくてはならない。ですから、書き込んだ直後だけでなく、50年先も問題なく読めることをめざしました。

データが経年劣化する進度をゆっくりにするためにはどうしたらいいのか、媒体を作っているメーカーさんと協力して研究しました。 実際に50年掛けてテストはできませんから、熱い槽の中に入れたり、湿度が高いところに入れたりして、劣化の速度を50年相当に速める加速試験をやりました。この試験で経年劣化の傾向を調べながら、どのようにレーザーパワーを制御すれば劣化の速度を遅くすることができるか検討しました。

どうやって劣化の速度を遅くしたのでしょうか。

小林光ディスクは、レーザーの熱で盤面を焦がして模様を残すような要領で、模様としてデータを書き込みます。この模様のことを「記録マーク」と呼びます。書き込んだ直後にベストの状態にするには、そのマークをはっきりくっきりと、大きく書いた方がよかった。

しかし、記録マークは物理的、科学的な経年変化により、読み取りの際の信号のノイズが増えて劣化します。経年劣化でにじみのような現象が起こり、そのにじみが広がることで隣同士のマークが重なって、つぶれて何も見えなくなるんですね。だから、マーク同士の間隔はなるべくしっかり確保しておいてあげないといけない。記録した直後にデータを読み出すにはマークが大きい方がいい、でも経年劣化すると読み出しにくくなってしまう、というトレードオフがあります。

ですから、経年劣化でにじみが起こっても50年先まで読める、そのベストなところを探していく、という地道な作業をしました。 図4に示すように、マークを書くときには最初と最後にレーザーの出力を上げるのですが、このパラメーターの比率が何億とおりもの組み合わせがあって、難しくて苦労しました。

図4 長期保存を実現するレーザーパワー制御技術
長期保存を実現するレーザーパワー制御技術の仕組みを示した図

何度も繰り返し、書き込みのテストをされたのですか。

小林そうですね。テストには、数ヶ月から半年くらい掛かりました。しかし、それだけの期間で終わったのは、いままでこの技術をずっと研究してきて、傾向の予測や定量的な見積もりをある程度机上でできるノウハウがあったからです。このノウハウがなかったなら、何度もテストを繰り返すことになって、何年たっても終わらなかったかもしれません。

50年先の読み出しエラーを救う

次に、誤り訂正符号によるエラー訂正の向上について教えてください。

大野誤り訂正符号というのは、データに冗長コードを入れておくことでエラーが発生してもデータを読み出せるようにするという技術です。今回はそのレベルを上げて、50年後にエラーが発生してもデータを読み出せるように、「RRC(Redundant Recovery Code)」という冗長コードを実装することに成功しました。

小林従来のブルーレイディスクでも、十分業務用途に耐えられるだけの品質はありました。ただし、50年後となると、媒体に偶発的についた傷などが原因で、数万回、数百万回に一つくらい、読めないデータが出てしまう。それはエンタープライズ向けでは許されないことです。そこで、加速試験によって予測できていた50年後のブルーレイディスクの品質を、さらに向上させるための冗長コードを入れました。

この技術では、ディスクの中のデータを入れる空間に、お客様のユーザーデータとは別に、冗長コードを挟むということをしています。この冗長コードがお客様から見えると、「知らないデータが入っている」と言われてしまうので、隠しておく必要があります。しかし、隠す方法がお客様にとって未知のやり方だと、どのようにデータがディスクに書かれているか、50年後にわからなくなってしまいます。そこで、我々はUDF(Universal Disk Format)というブルーレイディスクの国際規格に準拠した上で、冗長コードを入れるという新しい方法を考えました。

図5 RRCの実装方法
RRCの実装方法を示した図

従来のブルーレイディスクには、冗長コードが入っていなかったのですか。

小林いえ、冗長コード自体は元々入っています。今回もその機能は生かしたままで、その上に新しく追加したRRCをかぶせています。ですから、元から入っていた冗長コードを使ってエラーを回復させてみて、それでもダメなときの最終手段としてRRCを使います。このRRCによって、ブルーレイディスクの規格で対応できるものより大きな傷でも対応できるようになりました。

さらなる未来のストレージをめざして

アーカイブシステムは、今後どのように進化するのでしょうか。

写真「大野 千代(おおの ちよ)」

大野今回のアーカイブシステムではブルーレイディスクを使っていますが、ブルーレイディスクの規格が進み、さらに大容量になってきます。

いままで以上に多くのデータを扱うようになるので、ソフトウェアの改良や処理スピードの性能向上が、今後必要になってくると思います。

小林我々がめざしているのは信頼性や性能の向上で、この部分のアイデアは尽きません。今回は、長寿命に適した記録方法と冗長コードの技術をブルーレイディスクアーカイブシステムに生かすチャンスがあった。今後も、いろんな新しい技術を製品に適用したいと考えています。

さらに強力になった日立のストレージで、社会インフラに貢献できますね。

大野そうですね。日立では、これからクラウド事業に注力していくにあたり、お客様に最適なサービスをご提供できるよう、データのライフサイクルをすべてカバーできるようにストレージ製品をそろえようとしています。ですから、ブルーレイディスクアーカイブシステム、さらに次世代の媒体も使って、この事業を支えていくような研究開発をしていきたいと考えています。

また、ストレージシステムは社会インフラの一つですから、いろいろな分野で使われる可能性があります。その分野ごとの課題を、一つずつクリアしていきたいです。

写真「小林 正幸(こばやし まさゆき)」

小林ターゲットとなる分野ごとの課題をクリアする、というのは家電部門出身の大野さんらしい考え方ですよね。

家電では、例えば一人暮らしの人にはこういうテレビ、というようにターゲットを絞ります。絞ることで、そこに特化した使いやすいものができます。一方、ストレージシステムなど、エンタープライズ向けの製品では、どこでも使える万能なものをめざしがちです。

けれど、家電のような、変わったストレージを作るというのも楽しそうです。ターゲットを絞って特化することで、いままでできなかったことができるようになり、SFのような未来像の実現につながっていくのかもしれませんね。

*
Blu-ray Disc、ブルーレイディスク、BDXLは、Blu-ray Disc Associationの商標です。

特記事項

  • 2014年4月24日 公開
  • 所属、役職は公開当時のものです。

関連リンク

  • ページの先頭へ

類似キーワードコンテンツ

  • ページの先頭へ