Hitachi

[アドバイザリ]
ファームウェアバージョン20.34.1002以前のMellanox製VPI ConnectX6ネットワークアダプターとインテル第3世代Xeonスケーラブルプロセッサが搭載されている装置でRSODおよびUMCEが発生する現象について

概要

ファームウェアバージョン20.34.1002以前のMellanox製VPI ConnectX6ネットワークアダプターと、インテル第3世代Xeonスケーラブルプロセッサが搭載されている装置で、Red Screen of Death (RSOD)およびUncorrectable Machine Check Exception (UMCE)が発生する場合があります。

発生頻度

低

現象および影響範囲

ファームウェアバージョン20.34.1002以前のMellanox製VPI ConnectX6ネットワークアダプターと、インテル第3世代Xeonスケーラブルプロセッサが搭載されている装置で、BIOS/プラットフォーム構成 (RBSU)のBIOS設定を変更した後にサーバの再起動を実行すると、起動が失敗し、RSODが表示され、プロセッサ1のUMCEがログに記録される場合があります。 エラーが発生する場合の例を以下に示します。

  • WorkloadProfileを、GeneralPowerEfficientComputeとHighPerformanceCompute(HPC)の間で変更してから元に戻した後、サーバの再起動を実行する。
  • GeneralPowerEfficientComputeを使用している場合に、ipmctlコマンドによってpersistent memory (SCM)をMemoryモードからAppDirectモードに変更してから元に戻した後、サーバの再起動を実行する。

ただし、上記の変更を行った後、再起動の代わりにコールドブートを実行した場合や、複数回の再起動を実行した場合でも、エラーが発生しない可能性があります。

回避策

回避策はありません。

対策方法

次の日立Webページから対策版ファームウェアを収録したSPHをダウンロードしてください。
SPHをダウンロードの上、SPHのReadmeを参照し対策版ファームウェアを適用してください。

  • ダウンロードサイト(ドライバ/ファームウェア/ユーティリティ)

【Windows Server 2022/2019、RHEL8.6、VMware ESXi 8.0/7.0環境の場合】
 ファームウェアバージョン:20.35.1012 (SPH6.80収録バージョン) 以降

注意事項:

  • 対策版ファームウェアにアップデートする場合は、ドライバもSPHに収録されているバージョンに併せてアップデートしてご使用ください。
  • Windows Server 2016以前、RHEL8.5以前、VMware ESXi 6.7以前に対して、対策版ファームウェアの提供予定はありません。

対象製品

対象製品名 IB HDR100/EN 100Gb 2p QSFP56 Adptr (TQ-***-P23666-B21)

iLO Webインターフェイス画面で表示されるネットワークアダプターの名称が上記と異なる場合があります。詳細はADV-2022-0112を参照ください。
※「***」はお客さまのご購入製品により相違します。
対象装置 HA8000V/DL360 Gen10 Plus
HA8000V/DL380 Gen10 Plus

発生条件

対象バージョンのファームウェアバージョンを適用し、インテル第3世代Xeonスケーラブルプロセッサを搭載している場合に本現象が発生します。

対象バージョン

ファームウェアバージョン:20.35.1012 (SPH6.80収録バージョン) 未満

プロセッサの確認方法
・iLO Webインターフェイス画面のシステム情報のプロセッサから、プロセッサネームを確認します。下記のプロセッサネームが対象になります。
 Intel Xeon Platinum 83xx
 Intel Xeon Gold 53xx/63xx
 Intel Xeon Silver 43xx

対象OS

OS依存なし

関連するお知らせ・ドキュメント

ADV-2022-0112:iLOやシステムユーティリティにおいて表示されるネットワークアダプターの名称が異なる現象について

更新情報

2023年5月26日(公開)

*
本ページで記載している内容を予告なく変更することがありますので、あらかじめご了承ください。

文書番号

ADV-2023-0028