Hitachi

[重要なお知らせ]
MR Gen10 Plusコントローラー(MR416i-a)搭載装置において予期しないシャットダウンが発生時にデータ不整合が発生することがある事象について

概要

MR Gen10 Plusコントローラー(MR416i-a)搭載装置において予期しないシャットダウンが発生した後、POST中(初期化処理中)に「Controller Write Cache Data Has Been Lost」というメッセージが表示され、MR Gen10 Plusコントローラー(MR416i-a)がシステムから検出されず、データ不整合が発生する可能性があります。ただし、日立製品において事例報告はありません。
この事象の対策方法を以下に示します。

重要度

重要

発生頻度

低

現象および影響範囲

MR Gen10 Plusコントローラー(MR416i-a)搭載装置において予期しないシャットダウンが発生した後、POST中(初期化処理中)に以下のメッセージが1つまたは複数表示され、Integrated Management Log (IML) に記録されます。また、本事象の発生時は次回の再起動時にMR Gen10 Plusコントローラー(MR416i-a)がシステムから検出されなくなる場合があります。
対策を実施しない場合、予期しないシャットダウン発生時にデータ不整合が発生する可能性があります。

事象発生時のIML(表示例):

Server Critical Fault (Service Information: Power On Fault, Flexible Smart Array, ROC 1 Extended (85h)) ACTION: Gather Active Health System logs and create a support case.
Server Critical Fault (Service Information: Power On Fault Flexible Smart Array, ROC 1 (04h)) ACTION: Gather Active Health System logs and create a support case.
Server Critical Fault (Service Information: Power On Fault Flexible Smart Array, ROC 1 (04h), ROC 1 Extended (85h)) ACTION: Gather Active Health System logs and create a support case.
Power Fault Detected - Embedded Storage Controller 1. ACTION: Re-seat storage controller if removable. Otherwise, contact HPE service.
Slot XX Storage - Controller write cache data has been lost ACTION: 1. No action is required if unprotected write back enabled 2. Check for loose energy pack and controller backup power cable 3. Replace energy pack if failed 4. Update the controller firmware 5. Restore data from backup

回避策

回避策はありません。

回復策

該当のメッセージが表示されMR Gen10 Plusコントローラー(MR416i-a)がシステムから検出されない状態になっている場合は、[MR Gen10 Plusコントローラー(MR416i-a)の回復手順]を実施しMR Gen10 Plusコントローラー(MR416i-a)を回復してください。
回復手順を実施してもMR416i-a Gen10 Plusコントローラーが検出しない場合、保守作業による部品交換が必要になります。

■MR Gen10 Plusコントローラー(MR416i-a)の回復手順
  1. サーバの電源をオフし、AC電源コードを取り外します(AC電源コードを取り外し後、10秒間待ちます)。その後、AC電源コードを取り付けます。
  2. サーバーの電源をオンにし、システム装置の電源を投入後、[F9]キーを押して[System Utilities]を起動します。
  3. [システム構成]を選択し、MR416i-a Gen10 Plusコントローラー[HPE MR416i-a Gen10+]が表示されていることを確認します。

該当のメッセージが表示した場合、ライトキャッシュデータが消失しデータ破損した可能性があります。バックアップデータからの復旧を推奨します。

なお、コントローラーの回復作業(AC OFF/ON)およびバックアップデータからの復旧についてはお客さま作業となります。

対策方法

MR Gen10 Plusコントローラー(MR416i-a)のプログラマブルシステムオンチップ(以降:PSoC)ファームウェアバージョン0x1eを適用してください。

日立WebページにPSoCファームウェアのインストールモジュールを掲載しています。
次の日立Webページよりファームウェアをダウンロードの上、適用してください。

  • ダウンロードサイト(ドライバ/ファームウェア/ユーティリティ)

ファームウェアのアップデートは、オンラインで可能です。
作業時間は1台あたりオンライン:約10分となります。

PSoCファームウェアのアップデート後、サーバ電源のAC OFFが必要となります。

対象製品

対象製品名 MegaRAID MR416i-a Gen10 Plusコントローラー (TQ-***-P26279-B21)
※「***」はお客さまのご購入製品により相違します。

対象製品の確認方法
iLOメニューの「システム情報」−「デバイスインベントリ」を選択し、製品名より[HPE MR416i-a Gen10+]を確認します。
対象装置 HA8000V/DL360 Gen10
HA8000V/DL380 Gen10
HA8000V/DL20 Gen10 Plus
HA8000V/DL360 Gen10 Plus
HA8000V/DL380 Gen10 Plus

発生条件

不正なシャットダウンまたは電力の喪失が発生した場合。

対象バージョン

PSoCファームウェアバージョン0x1d (10進数の29) またはそれ以前を使用するMR416i-a Gen10 Plusコントローラー

バージョン確認方法

■インストールモジュールを使用した確認方法

日立Webページよりインストールモジュールを入手し、PSoCファームウェアのインストールモジュールを実行します。
インストールモジュールの実行によって「PSOCファームウェアバージョン」が表示されます。
PSoCファームウェアが 0x1dまたはそれ以前の場合は以下が表示されインストールが実行可能となります。
 PSOC Firmware version : 0x1d
 Do you want to continue with PSOC firmware flashing - (Y/N):

PSoCファームウェアがすでに0x1eの状態になっている場合は、以下のPSoCファームウェアバージョンが表示されます。
インストールは実行されません。
 PSOC Firmware version : 0x1e

■システムユーティリティからのバージョン確認方法
  1. サーバーの電源をオンにし、システム装置の電源を投入し、[F9]キーを押して[System Utilities]を起動します。
  2. [システム構成]―[HPE MR416i-a Gen10+]―[Main Menu]―[Controller Management]を選択し、[PSOC Firmware Version]を確認します。
システム構成
※
システムユーティリティから[PSOC Firmware Version]を確認する場合、MR416i-a Gen10 Plusコントローラーのファームウェアバージョンが52.22.3-4650以降である必要があります。

対象OS

OS依存なし

更新情報

2023年9月1日(更新)
対策方法を更新しました。
2023年7月28日(公開)
*
本ページで記載している内容を予告なく変更することがありますので、あらかじめご了承ください。

文書番号

CRI-2023-0007