Hitachi

概要

VMware ESXi 6.5またはVMware ESXi 6.7環境でNVMe SSDが重大な温度アラートを報告し、オフラインになることがあります。

発生頻度

現象および影響範囲

本現象は以下の条件で発生することがあります。

  • VMware ESXi 6.5またはVMware ESXi 6.7環境
  • Intel製 NVMe SSD(P4500/P4600モデル)搭載 (詳細は対象製品名参照)
  • BIOSで最大冷却が有効に設定しており、吸気口の周囲温度が摂氏10度前後

IMLによる重大な温度超過の報告:

Temperature exceeded on PCIe disk NVMe Drive Port 4B Box 1 Bay 3.
ACTION: Check the system for hardware failures and verify the environment is properly cooled

Vmkwarning.log:

2019-02-08T16:40:29.232Z cpu25:72606)WARNING: NMP: vmk_NmpSatpIssueTUR:1050: Device t10.NVMe____VO002000KWJSF___________________________000117E37CE4D25C path vmhba10:C0:T0:L0 hit an unrecoverable hardware error

Vmkernel.log:

2019-02-15T02:24:31.334Z cpu34:65570)nvme:AsyncEventReportComplete:3007:Smart health event: Temperature above threshold

NVMe CLIツールがマイナス1℃(272 K)と示す:

[root@vhk1i210xsdi136:~] esxcli nvme device log smart get -A vmhba3
SMART And Health Info:
Available Spare Space Below Threshold: false
Temperature Warning: true
NVM Subsystem Reliability Degradation: false
Read Only Mode: false
Volatile Memory Backup Device Failure: false
Composite Temperature: 272 K

回避策

BIOSの冷却設定を以下のように変更してください。

  • HA8000V/DL360、DL380 :増強冷却
  • HA8000V/DL580、ML350 :最適冷却

対策方法

以下のVMware ESXiパッチに更新してください。

VMwareパッチの使用方法の詳細について以下のドキュメントの「APPENDIS T:USING VMWARE PATCHES」を参照してください。

ファームウェアバージョンおよびModel Numberの確認手順

  1. iLO Web コンソールにログインしてください。
  2. 画面左側のメニューの「システム情報」を選択します。
  3. 表示された画面中央上部のメニューから「ストレージ」を選択します。
  4. 装置に搭載しているSmartアレイの情報が確認できます。「論理ビュー」が選択されている場合は、「物理ドライブ」を選択してください。
  5. ドライブを選択すると画面右側のドライブ詳細にファームウェアバージョンとModel Numberが表示されます。
    「Model」:Model Number 「Revision」:ファームウェアバージョン
    ファームウェアバージョンイメージ

対象製品

対象製品名 1TB NVMe x4 RI SFF SCN DS SSD (VO001000KWJSE)
1.6TB NVMe x4 MU SFF SCN SSD (MO001600KWJSN)
2TB NVMe x4 RI SFF SCN DS SSD (VO002000KWJSF)
3.2TB NVMe x4 MU SFF SCN DS SSD (MO003200KWJSQ)
4TB NVMe x4 RI SFF SCN DS SSD (VO004000KWJSH)
4TB PCIe x4 RI HH DS Card (VT004000KWJSU)
6.4TB NVMe x4 MU SFF SCN DS SSD (MO006400KWJSR)
※ ( )内はModel Numberを示します。
対象装置 HA8000V/DL360 Gen10
HA8000V/DL380 Gen10
HA8000V/DL580 Gen10
HA8000V/ML350 Gen10

発生条件

対象製品とBIOSで最大冷却が有効設定の組み合わせで発生する

対象バージョン

NVMe SSDのファームウェアバージョン依存なし

対象OS

VMware ESXi 6.5またはVMware ESXi 6.7環境 (VMware ESXi 6.0は対象外)

更新情報

2022年3月4日(更新):販売形名の削除、Model Number確認方法を追加
2020年12月25日 (公開)

*
本ページで記載している内容を予告なく変更することがありますので、あらかじめご了承ください。

文書番号

ADV-2020-0088