Hitachi

概要

Smart アレイGen10 コントローラー搭載装置(ファームウェアバージョン3.53以降)において、VMware ESXi環境使用時にsmx-providerがクラッシュしESXi/vCenterで「The physical element is failing」というエラーが表示されることがあります。この現象の対策方法を以下に示します。

発生頻度

現象および影響範囲

Smart アレイ Gen10 コントローラー搭載装置(ファームウェアバージョン3.53以降)において、VMware ESXi環境使用時にsmx-providerがクラッシュし、以下に示すような 「The physical element is failing」というエラーが、ESXi / vCenterのグラフィカルユーザーインターフェイスの[ストレージ]タブに表示される場合があります。

The physical element is failing

この現象が発生する際、次のようなメッセージがvmkernelとsyslogに記録される場合があります。

Vmkernel

MemSchedAdmit: 478: UserWorld 'sfcb-smx' with cmdline '/bin/sfcbd'
MemSchedAdmit: 489: uw.2100562 (12781) extraMin/extraFromParent: 256/256, smx (11852) childEmin/eMinLimit: 17861/17920
User: 3173: sfcb-smx: wantCoreDump:sfcb-smx signal:6 exitCode:0 coredump:enabled
UserDump: 3110: sfcb-smx: Dumping cartel 2100562 (from world 2100566) to file /var/core/sfcb-smx-zdump.000 ...
UserDump: 3258: sfcb-smx: Userworld(sfcb-smx) coredump complete.
DVFilter: 6068: Checking disconnected filters for timeouts
MemSchedAdmit: 471: Admission failure in path: smx/sfcb-ProviderMa.2101578/uw.2101578
MemSchedAdmit: 478: UserWorld 'sfcb-smx' with cmdline '/bin/sfcbd'
MemSchedAdmit: 489: uw.2101578 (20057) extraMin/extraFromParent: 148/148, smx (11852) childEmin/eMinLimit:

Syslog

sfcbd[2100569]: Dropped response operation details -- nameSpace: root/hpq, className: SMX_AutoStartSmartArray, Type: 0
sfcb-ProviderManager[2100415]: TIMEOUT DOING SHARED SOCKET RECV RESULT (2100415)
sfcb-ProviderManager[2100415]: Timeout (or other socket error) waiting for response from provider
sfcb-ProviderManager[2100415]: Header Id (256) Request to provider 192 in process 4 failed. Error:Timeout (or other socket error) waiting for response from provider
sfcb-ProviderManager[2100415]: Dropped response operation details -- nameSpace: root/cimv2, className: HPVC_SABattery, Type: 0
sfcb-ProviderManager[2100415]: lookupProviderList: searched 0 providers for root/cimv2:HPVC_SABattery not found, returning error
crond[2099006]: USER root pid 2101676 cmd /bin/hostd-probe.sh ++group=host/vim/vmvisor/hostd-probe/stats/sh
sfcbd[2101605]: tool_mm_realloc_or_die: memory re-allocation failed(orig=343600 new=344000 msg=Cannot allocate memory, aborting
fcb-ProviderManager[2100415]: handleSigChld:172612416 provider terminated, pid=2101605, exit=0 signal=

※ sfcb-smx-zdumpが/var/coreディレクトリに保存されます。

回避策

回避策はありません。

対策方法

「smx-provider」を削除してください。「smx-provider」を削除するには、ESXiシェルで次のコマンドを実行します。
「smx-provider」を削除した後、システムを再起動する必要があります。
※「smx-provider」を削除した場合、vCenterからSmart アレイ関連の情報を入手できなくなります。Smart アレイ関連の情報取得については、iLO等のユーティリティから確認をお願いいたします。

ESXi 6.5 または ESXi 6.7の場合
 esxcli software vib remove -n smx-provider
ESXi 7.0の場合
 esxcli software component remove -n smxProvider

  • ESXiカスタムイメージ、vibsdepot、またはESXi用のオフラインバンドルを使用してESXiホストを再度更新すると、smx-providerが再インストールされる場合があります。その場合は手動で再度smx-providerを削除する必要があります。
  • smx-providerを削除しても、Service Pack for HA8000V (SPH)を使用したオンライン更新には影響しません。

対象製品

対象製品名 SmartアレイGen10コントローラー
 Smartアレイ P816i-a SR Gen10コントローラー (TQ-***-804338-B21)
 Smartアレイ P408i-a SR Gen10コントローラー (TQ-***-804331-B21)
 Smartアレイ P408i-a SR Gen10 LH コントローラー (TQ-***-869081-B21)
 Smartアレイ P408i-p SR Gen10コントローラー (TQ-***-830824-B21)
 Smartアレイ E208i-a SR Gen10コントローラー (TQ-***-804326-B21)
 Smartアレイ E208i-a SR Gen10 LH コントローラー (TQ-***-869079-B21)
 Smartアレイ E208i-p SR Gen10コントローラー (TQ-***-804394-B21)
 Smartアレイ E208e-p SR Gen10コントローラー (TQ-***-804398-B21)
 Smartアレイ E208i-p SR Gen10コントローラー (TJ****-804394-B21)
 ※ 「***」はお客さまのご購入製品により相違します
対象装置 HA8000V/DL360 Gen10 for Nutanix
HA8000V/DL380 Gen10 for Nutanix

発生条件

特定の発生条件はありません。

対象バージョン

SmartアレイGen10コントローラーファームウェア:バージョン 3.53 以降

対象OS

VMware vSphere® ESXi 7.0
VMware vSphere® ESXi 6.7
VMware vSphere® ESXi 6.5

更新情報

2021年11月26日(公開)

*
本ページで記載している内容を予告なく変更することがありますので、あらかじめご了承ください。

文書番号

ADV-2021-0086b