VMware ESXi 6.5またはVMware ESXi 6.7環境でNVMe SSDが重大な温度アラートを報告し、オフラインになることがあります。
低
本現象は以下の条件で発生することがあります。
Temperature exceeded on PCIe disk NVMe Drive Port 4B Box 1 Bay 3.
ACTION: Check the system for hardware failures and verify the environment is properly cooled
2019-02-08T16:40:29.232Z cpu25:72606)WARNING: NMP: vmk_NmpSatpIssueTUR:1050: Device t10.NVMe____VO002000KWJSF___________________________000117E37CE4D25C path vmhba10:C0:T0:L0 hit an unrecoverable hardware error
2019-02-15T02:24:31.334Z cpu34:65570)nvme:AsyncEventReportComplete:3007:Smart health event: Temperature above threshold
[root@vhk1i210xsdi136:~] esxcli nvme device log smart get -A vmhba3
SMART And Health Info:
Available Spare Space Below Threshold: false
Temperature Warning: true
NVM Subsystem Reliability Degradation: false
Read Only Mode: false
Volatile Memory Backup Device Failure: false
Composite Temperature: 272 K
BIOSの冷却設定を以下のように変更してください。
以下のVMware ESXiパッチに更新してください。
VMwareパッチの使用方法の詳細について以下のドキュメントの「APPENDIS T:USING VMWARE PATCHES」を参照してください。
対象製品名 |
1TB NVMe x4 RI SFF SCN DS SSD (VO001000KWJSE) 1.6TB NVMe x4 MU SFF SCN SSD (MO001600KWJSN) 2TB NVMe x4 RI SFF SCN DS SSD (VO002000KWJSF) 3.2TB NVMe x4 MU SFF SCN DS SSD (MO003200KWJSQ) 4TB NVMe x4 RI SFF SCN DS SSD (VO004000KWJSH) 4TB PCIe x4 RI HH DS Card (VT004000KWJSU) 6.4TB NVMe x4 MU SFF SCN DS SSD (MO006400KWJSR) ※ ( )内はModel Numberを示します。 |
---|---|
対象装置 |
HA8000V/DL360 Gen10 HA8000V/DL380 Gen10 HA8000V/DL580 Gen10 HA8000V/ML350 Gen10 |
対象製品とBIOSで最大冷却が有効設定の組み合わせで発生する
NVMe SSDのファームウェアバージョン依存なし
VMware ESXi 6.5またはVMware ESXi 6.7環境 (VMware ESXi 6.0は対象外)
2022年3月4日(更新):販売形名の削除、Model Number確認方法を追加
2020年12月25日 (公開)
ADV-2020-0088