ページの本文へ

Hitachi

企業情報研究開発

2016年8月1日

発表者からのレポート


写真1 IIAI AAI 2016の会場パネル

2016年7月10日から7月14日までの5日間、5th International Congress on Advanced Applied Informatics (IIAI AAI2016) が熊本県で開催されました(写真1)。IIAI AAIは、日本とアジアの研究者が主に参加する国際会議で、7つのカンファレンスから構成されています。IIAI AAIでは、コンピュータアーキテクチャだけでなく、教育システムや人工知能といった、情報システムに関する幅広いトピックを扱っています。今年は、口頭発表とポスター発表を合わせて271件の発表がありました。そのうち、データサイエンス関連が23件、人工知能関連が32件、アーキテクチャ関連が54件となっており、これらの分野の関心が高いようでした。今回、筆者はEAIS2016 (The 1st International Conference on Enterprise Architecture and Information Systems) で、「REC2:Restoration Method Using Combination of Replication and Erasure Coding」と題した発表を行いました。

2011年に発生した東日本大震災のような大規模災害が発生すると、多数の情報システムが強い揺れや津波などにより損壊します。情報システムには、復旧に必要な情報(住民情報、医療情報など)が格納されている場合があり、そのような情報システムを早急に復旧する必要があります。

そのため、災害前に、データ保護機能を用いてデータをバックアップサーバへ定期的にバックアップしておきます。災害によって情報システムが損壊した場合、復旧時にバックアップデータをリストアします。このリストアにかかる時間が長く、情報システムの早急な復旧を妨げています。

リストア時間を短縮するため、一般に、バックアップサーバ数を増加させてバックアップデータを並列に取得することが行われます。しかし、バックアップサーバ数を増加させると、バックアップデータも増加し、管理コストが増大する問題が発生します。つまり、リストアの高速化とバックアップデータ容量の削減はトレードオフの関係となります。さらに、大規模災害が発生すると、ほぼすべてのバックアップサーバが一時的に停止し、その後しばらくした後に回復していくため、複数のバックアップサーバを用いてもリストアを開始できないといったことも考えられます。


図1 REC2方式の概要
拡大図

そこで筆者らは、バックアップリストアで一般に用いられるレプリケーション方式とErasure Coding方式を併用するREC2を提案しました。レプリケーション方式は、オブジェクトをバックアップサーバへそのまま複製する方式です。災害直後からリストアを開始できますが、バックアップ容量が増加しやすいという問題があります。一方、Erasure Coding方式は、オブジェクトをチャンクへ分割し、さらに、パリティを作成して、それらをバックアップサーバへ保存する方式です。バックアップ容量が増加しにくいのですが、リストア開始までの待ち時間が長いという問題があります。提案方式は、それぞれの方式の利点を生かす方式です(図1)。東日本大震災後を想定した条件による評価の結果、8台のバックアップサーバ構成で4 MBのファイルをリストアする場合において、最も短時間にリストアできる8レプリケーションの場合と比較して、バックアップ容量を半分程度に抑え、8.7%のリストア時間延長に抑えられることを示しました。

なお本研究は、文部科学省による委託研究「高機能高可用性情報ストレージ基盤技術の開発」として、東北大学と(株)日立ソリューションズ東日本と共同で推進しています。

(亀井 仁志    記)

関連論文

  • Hitoshi Kamei, Shinya Matsumoto, Takaki Nakamura, and Hiroaki Muraoka, "REC2: Restoration Method Using Combination of Replication and Erasure Coding," In Proc. of IIAI International Congress on Advanced Applied Informatics 2016 (IIAI AAI 2016), pp.936-941, 2016.
  • ページの先頭へ