StatelessError ?

久しぶりに焦りました(汗.

ESXi の Patch (ESXi670-202006001) あててたのですが,Node の 1 台で StatelessError なるものに遭遇.

[root@fqdn:/vmfs/volumes/path/to/patch] esxcli software profile update --dry-run -p ESXi-6.7.0-20200604001-standard -d /vmfs/volumes/path/to/patch/ESXi670-202006001.zip

 [StatelessError]
 The transaction is not supported: VIB VMW_bootbank_nfnic_4.0.0.44-0vmw.670.3.104.16075168 cannot be live installed. VIB VMW_bootbank_sfvmk_1.0.0.1003-7vmw.670.3.104.16075168 cannot be live installed. ...


もちろん,Node は Maintenance Mode です.何か嫌な状態になっていそうなので,Node 再起動後に再チャレンジと思ったのですが,ESXi が起動せず(泣笑).OS 用 Disk は RAID1 組んでますが,Console 見てると起動時に Storage Controller の画面を Skip してるようなので,IPMI から覗いてみました.すると案の定 "StorageController0 access degraded or unavailable" と event log に記録されていました.

f:id:tcpninja:20200613175604p:plain

対象の Controller は Broadcom 3108 で,リアの Hot-Swap ドライブベイに積んだ NAND SSD につながっています.

f:id:tcpninja:20200613181705p:plain

もう土曜の午後なので,代替パーツは月曜以降でないと入手できなそうだし,このまま 1 Node 停止させて週末を過ごすのも不安だったので,ダメ元で 3108 を引き抜いて差し直してみる事に.

f:id:tcpninja:20200613183416p:plain

もちろん,ケーブルも一旦抜いてしっかり差し直し.完全に神頼み状態でしたが,なんと無事復活(苦笑).とりあえず今週末は眠れそうです.来週早々予防交換かな?

f:id:tcpninja:20200613183950p:plain

SMC サーバーは筐体開けると Chassis Intrusion が記録されて,放置していると vCenter に Alarm が出るので,IPMI から必ず Intrusion Reset するのを忘れずに.

f:id:tcpninja:20200613184622p:plain