
ITの進展と利用拡大によりデジタルデータは加速度的に増加している。この「情報爆発」と呼ぶにふさわしい現状は、企業のデータ・バックアップにも大きな影響を与えている。本連載では、ビッグデータ時代に求められるバックアップのあり方を示し、個々の課題に応じた解決アプローチや技術対策について解説する。
世界中で利用されるデジタルデータの量は、すさまじい勢いで拡大の一途をたどっている。シマンテックが公開する調査結果によれば、全世界の企業が格納している情報量は、2012年において合計 2.2 ゼタバイトにも及ぶという(シマンテック「企業が保有する情報に関する調査」)。Facebookが管理するユーザーの写真と動画コンテンツは、既に100ペタバイトに達している(Facebook社発表)。南カリフォルニア大学のマーティン・ヒルバート博士によれば、一般用途のストレージは年間58%の割合で容量が増加しており、データ量は指数関数的に増加することが示唆される(2011年米サイエンス誌)。さらに、データの流通量の観点からも増加傾向は顕著である。シスコシステムズによれば、2011年から2016年にかけて世界のモバイルデータ・トラフィック量は18倍増加し、2016年には年間130エクサバイトに達することが推定されている。国内でも経済産業省が、2025年にはネットワークのデータ伝送速度が、2006年の190倍の121テラbps(ビット/秒)に達すると予測している。
ITRの調査では、2015年には、約34%の企業がビッグデータの分析・活用を行う予定であり、容量や流通量が増加しているだけでなく、企業におけるデータ利用機会も拡大することが見込まれている(「国内IT投資動向調査報告書2013」より)。このように持続的なIT革新と利用拡大により、デジタルデータは加速度的に増加しているのが現状である。まさに現代は、情報爆発というにふさわしい時代となっている。そして、このことは企業のデータ管理とバックアップのあり方にも大きな影響を及ぼしている。
企業内で増え続けるデータは、その本番運用もさることながら、バックアップをいかに取得するかがシステム管理者の悩ましい課題となる。バックアップ用の資源や時間が限られるなかで、企業は大容量データを確実にバックアップする必要があり、障害/災害時にも速やかに直近データに戻せるように備えておくことが不可欠である。また、新たなアプリケーションの導入、仮想化技術の採用、クラウドサービスの活用など複雑化するシステム管理環境への対応も同時に行わなければならない。
適切なデータ・バックアップへ向けては、企業が、情報ライフサイクルを視野に入れた「データ管理方針」を整備しておくことが前提となる。つまり、各々のデータの用途(メールデータ、会計データ、資産管理データ、など)にどのような管理を行うかを、ビジネス要求を鑑みて方針化しなければならない。例えば、メールデータは、日次バックアップのうえ、障害/災害時は2時間以内に復旧するものとし、生成3年後にアーカイビング(長期保管)する、といった方針を定める。この方針に基づいて、バックアップ対象となるデータを絞り込み、各々のサービスレベル(RTO:復旧時間目標、RPO:復旧時点目標、バックアップ所要時間、セキュリティ対策など)を設定することとなる。
大容量データを扱う場合は、バックアップ・データの保管に必要なストレージ資源を節約してコストを抑えることが重要だ。従来の手法ではバックアップ取得に時間がかかるため、スピード向上のための施策も必要になる。また、最近ではDBMSなどに管理される構造化データに加え、非構造化データの増加が著しい。データ特性に応じたバックアップ手法を選択的に検討することで、最適なソリューションを採用する必要がある。

図1 情報爆発の時代
(出典 公開情報を元にITRが作成)
ビッグデータ時代のバックアップでは、以下3点の対応を重視すべきである。
個々の詳細については、次回以降述べていくこととする。なお、システムごとに力技でバックアップする環境を手当てしても、運用管理コストが膨らみ、バックアップ、リカバリ作業も煩雑化してしまう。バックアップにおける統合的な運用管理の仕組み構築することで、今後の更なるデータの増加への対応やコスト抑制が期待できる。この点については最終回で取り上げる。
株式会社アイ・ティ・アール プリンシパル・アナリスト 金谷 敏尊氏
株式会社アイ・ティ・アール(新規ウィンドウを開く)