ページの本文へ

Hitachi

徹底解説!一歩先のストレージ管理

確実なデータ保護を実現するコピー機能を使いこなす

②リモートコピー機能の特徴 その2 ― global-active device(GAD) ―へ

長江さん

TrueCopyとUniversal Replicatorでは、正サイトのストレージシステムに障害が発生すると、正サイトのホストサーバからは業務を継続できませんでした

しかしGADを使えばこの問題を解決できます

長江
GADを一言でいうと、次のようになるでしょう。

リモートコピー機能 3GAD

2台のストレージシステムで同一のデータを保持し、障害が発生しても業務を無停止で継続できる技術

国府津さん

正サイトのストレージシステムに障害が発生しても、正サイトで業務を継続できるというのは夢のような話ですが、どのように実現しているのでしょうか

長江さん

GADは日立のミッドレンジファミリーの高い信頼性を象徴する機能ですので、ご期待ください

GADによる高信頼なデータ保護で災害発生時も業務を継続

長江
まず、GADの構成からご説明します。下の図をご覧ください。正サイトと副サイトのホストサーバが、他方のサイトにあるストレージシステムへ、クロスするように接続されています。そして、ストレージ間では同期コピーを実施しています。

GADの構成のイメージ

国府津
クロスしているパスの中央に、仮想ストレージが表現されていますが、どのような意味があるのでしょうか。
長江
ホストサーバの視点で見ると、どちらか一方のストレージシステムに障害が発生しても業務を継続できるため、「仮想的に1台のストレージシステムにアクセスし続けているように見える」ことを表しています。
国府津
Quorumディスクとは何でしょうか。
長江
パスやストレージシステムに障害が発生した際、障害を検知したストレージシステムが、障害発生の事実を他方のストレージシステムに伝えるために利用します。正サイトおよび副サイトのストレージシステムは、障害の発生を検知するために、定期的にQuorumディスクにアクセスします。
国府津
例えば、何らかの障害で、正サイトのストレージシステムから副サイトのストレージシステムへデータのコピーができなくなった場合はどうするのでしょうか。
長江
正サイトのストレージシステムはQuorumディスクに、副サイトへのコピーができないことを書き込みます。一方、副サイトのストレージシステムは、Quorumディスクにアクセスした際にその事実を検知します。副ボリュームが正ボリュームと同期できない状態にあるため、副サイトのストレージシステムは、ホストサーバからのI/Oの受付を停止した上で、そのことをQuorumディスクに書き込みます。正サイトのストレージシステムがQuorumディスクにアクセスした際に、副サイトのストレージシステムがI/Oの受付を停止したことを検知す ると、正ボリュームと副ボリュームのコピーペアを解除した上で、ホストサーバからのI/Oの受付を継続します。
国府津
GADの構成は理解しました。この仕組みで高い信頼性を実現しているということですが、具体的にどのようなメリットがあるのでしょうか。
長江
GADの代表的なメリットをご紹介します。
1一方のストレージシステムに障害が発生しても、もう一方のストレージシステムを利用して業務を継続できます。
他サイトのストレージシステムへのパスを利用して、これまでと同じデータにアクセスできます。業務を副サイトに移す、などの作業が不要です。
2一方のホストサーバに障害が発生しても、サーバのクラスタソフトウェアを使用して、フェイルオーバおよびフェイルバックできます。
障害が発生していないホストサーバから、これまでと同じデータにアクセスできます。
ストレージシステム側でGADのコピーペアの分割や再同期は不要です。
3一方のホストサーバにある仮想マシンの負荷が高くなっているときに、ストレージシステムを操作せずに、仮想マシンだけをもう一方のホストサーバへ移動できます。
どちらのホストサーバからでも同じデータにアクセスできるため、VMを移動しても、ストレージシステムでデータ移行作業などをすることなく業務を継続できます。
長江
このように、GADを利用することで、高い信頼性を求められるクラウド環境を実現できます。
ただし、同期コピーですので、正サイトから副サイトまでの距離はTrueCopyの場合と同様になります。

国府津さん

リモートコピーの機能はこのように整理できそうですね

キャプションを入れてください。
TrueCopy Universal Replicator global-active device
データ転送距離の目安 中
100km以内
長
100km以上
中
100km以内
ホストI/O性能 中
同期を待つ時間がかかる
速
非同期のため待ち時間がかからない
中
同期を待つ時間がかかる
RPO(*1) なし
副サイトに正サイトと同じデータが存在
多
正サイトの差分データを損失する可能性あり
なし
副サイトに正サイトと同じデータが存在
RTO(*2) 長
正サイトが復旧するまで、副サイトで業務を再開要
長
正サイトが復旧するまで、副サイトで業務を再開要
なし
副サイトのデータで業務を継続可能
投資コスト 中
2台のストレージシステムが必要
中
2台のストレージシステムが必要
高
Quorumディスク用を含め3台必要
  • *1:Recovery Point Objective:目標復旧時点
    情報システムの停止等の事故・事件が発生した場合に、どの程度古いデータに遡らなければならないかを示すリカバリポイントの目安。損失データ量に相当する
  • *2:Recovery Time Objective:目標復旧時間
    業務中断が発生した場合に、業務に重大な影響を及ぼさないうちに業務を復旧・再開させるための目標時間

長江さん

業務に与える損失と投資コストを考慮した運用が必要になります

それでは最後に、コピー管理を支援するツール「Replication Manager」について、次のページでご説明しましょう