Hitachi

ESXi 6.5環境にてHDD交換時RAIDボード障害を誤検出する現象について。

Hitachi Server Navigator - Log Monitor 障害回避・予防のお願い

対象製品

【Blade Symphony】

対象製品 対象コンポーネント 対象バージョン 対策バージョン 提供パッケージバージョン
Hitachi Server Navigator - Log Monitor (vMA版) - 09-18 以前 2017年6月サポート予定
Hitachi Server Navigator - Log Monitor (Linux(ゲストOS)版) - 09-18 以前 2017年6月サポート予定

【HA8000】

対象製品 対象コンポーネント 対象バージョン 対策バージョン 提供パッケージバージョン
Hitachi Server Navigator - Log Monitor (vMA版) - 86-20 以前 2017年6月サポート予定
Hitachi Server Navigator - Log Monitor (Linux(ゲストOS)版) - 46-20 以前 2017年6月サポート予定

関連製品

ありません。

重要性 *1

現象

HDD交換作業時もしくはRAIDボードに関連する障害発生時に、「Hitachi Compute Systems Manager(以降HCSM)」、「Webコンソール( *1)」にてRAIDボード故障を示すイベントが検出されます。
(*1)BladeSymphonyのみ。HA8000は対象外となります。 

●HCSMにて検出されるイベントは以下となります。
◇HA8000の場合
[日本語版]
アラートID:{アラートID} アラートレベル:{アラートレベル}
メッセージ:OS上のイベントが記録されました。(対象部位:MSM, {詳細メッセージ} (OS:VMware))

[英語版]
アラートID:{アラートID} アラートレベル:{アラートレベル}
メッセージ:OS event is logged.(Part:MSM, {詳細メッセージ} (OS:VMware))

{アラートID}{アラートレベル}{詳細メッセージ}には、以下のいずれかの組合せが入ります。
No. アラートID アラートレベル 詳細メッセージ
1 0xFE81 警告/Warning Controller cache discarded due to firmware version incompatibility
2 0xFE82 障害/Error Fatal firmware error
3 0xFE82 障害/Error Flash erase error
4 0xFE82 障害/Error Flash timeout during erase
5 0xFE82 障害/Error Flash error
6 0xFE82 障害/Error Flash programming error
7 0xFE82 障害/Error Flash timeout during programming
8 0xFE82 障害/Error Flash chip type unknown
9 0xFE82 障害/Error Flash command set unknown
10 0xFE82 障害/Error Flash verify failure
◇BladeSymphonyの場合
[日本語版]
アラートID:{アラートID} アラートレベル:{アラートレベル}
メッセージ:サーバで障害が発生しました。(指摘部位:Server Blade %d - RAID(*2),発生事象:{詳細メッセージ})

[英語版]
アラートID:{アラートID} アラートレベル:{アラートレベル}
メッセージ:On server, an error event occurred.(Location:Server Blade %d - RAID(*2),Event:{詳細メッセージ})

(*2) %d:スロット番号

{アラートID}{アラートレベル}{詳細メッセージ}には、以下のいずれかの組合せが入ります。
No. アラートID アラートレベル 詳細メッセージ
1 0xFD41 障害/Error Controller cache discarded due to firmware version incompatibility
2 0xFD41 障害/Error Fatal firmware error
3 0xFD41 障害/Error Flash erase error
4 0xFD41 障害/Error Flash timeout during erase
5 0xFD41 障害/Error Flash error
6 0xFD41 障害/Error Flash programming error
7 0xFD41 障害/Error Flash timeout during programming
8 0xFD41 障害/Error Flash chip type unknown
9 0xFD41 障害/Error Flash command set unknown
10 0xFD41 障害/Error Flash verify failure
●Webコンソールにて誤検出されるイベントは以下となります。
 System Event Logに以下のイベントが誤検出されます。
No. アラートレベル 詳細メッセージ
1 障害/Fail ディスクアレイコントローラボードのファームウェアバージョン不一致のため、キャッシュデータを破棄しました。一部のデータが失われたおそれがあります。
Controller cache discarded due to firmware version incompatibility
2 障害/Fail ファームウェアが致命的な問題を検出しました。
Fatal firmware error
3 障害/Fail ディスクアレイコントローラ上フラッシュメモリの初期化に失敗しました。
Flash erase error
4 障害/Fail ディスクアレイコントローラ上フラッシュメモリの初期化中にタイムアウトが発生しました。
Flash timeout during erase
5 障害/Fail ディスクアレイコントローラ上フラッシュメモリへのアクセスに失敗しました。
Flash error
6 障害/Fail ディスクアレイコントローラ上フラッシュメモリへの書き込みに失敗しました。
Flash programming error
7 障害/Fail ディスクアレイコントローラ上フラッシュメモリへの書き込み処理中にタイムアウトが発生しました。
Flash timeout during programming
8 障害/Fail ディスクアレイコントローラ上のフラッシュは,不明なフラッシュメモリです。
Flash chip type unknown
9 障害/Fail 不明なフラッシュコマンドです。
Flash command set unknown
10 障害/Fail ディスクアレイコントローラ上フラッシュメモリのベリファイでエラーが発生しました。
Flash verify failure
<<影響範囲>>
イベントの検出のみで、システム停止は発生しません。

発生条件

次の条件のすべてに該当する場合に、本現象が発生します。
  • 次の対象装置および対象OSであること
  • HDD交換作業時(オンライン交換時、リビルド完了時)もしくはRAIDボードに関連する障害発生時
対象装置 HA8000 HA8000/RS440(AN1,BN1)
HA8000/RS110(AN,BN,CN,DN)
HA8000/TS10(AN,BN,CN,DN)
HA8000/TS20(AN2,BN2,CN2,DN2)
HA8000/RS210(AN2)
HA8000/RS220(AN2)
HA8000/TS20(AN,BN,CN,DN)
HA8000/RS210(AN1)
HA8000/RS220(AN1)
BladeSymphony BS2500 高性能サーバブレード(xHE0A2,xHE0A3)
標準サーバブレード(xHC0A1,xHC0A2)
BladeSymphony BS500 BS520Hサーバブレード(xGC0B3,xGC0B4)
BS520Xサーバブレード(xGE0B2)
対象OS VMware VMware vSphere® ESXi 6.5

現象発生時の回復策

回復策は必要ありません。システムが停止していない場合は、そのままお使いください。システム停止もしくは本イベント以外で障害/警告のイベントが発生している場合は、RAIDボードに関連する別障害が発生していることが考えられますので保守員をお呼びください。

対象バージョンでの回避策

回避策はありません。
Log Monitorの対策バージョンへのアップデートをお願いいたします。

<<バージョン確認方法>>

・Hitachi Server Navigator - Log Monitor (vMA版/Linux(ゲストOS)版)

下記サイトより、
「Hitachi Server Navigator ユーザーズガイド Log Monitor機能 VMware vMA版 (旧名称:ハードウェア保守エージェント) VMware® ESXi 対応版」-「vMA版Log Monitorの導入」-「バージョンの確認」
を参照してください。

<<対策バージョンの入手、適用方法>>

下記サイトより、
対策バージョンをダウンロードして、ダウンロードページに記載の手順にて、適用してください。

<<対策版へのアップデート方法>>
  <対象製品>に記載の<<対策バージョンの入手、適用方法>>に従ってアップデートしてください。

<<アップデート後のバージョン確認方法>>
  <対象製品>に記載の<<バージョン確認方法>>の方法で、対策バージョンになったことを確認してください。