久しぶりに焦りました(汗.
ESXi の Patch (ESXi670-202006001) あててたのですが,Node の 1 台で StatelessError なるものに遭遇.
[root@fqdn:/vmfs/volumes/path/to/patch] esxcli software profile update --dry-run -p ESXi-6.7.0-20200604001-standard -d /vmfs/volumes/path/to/patch/ESXi670-202006001.zip [StatelessError] The transaction is not supported: VIB VMW_bootbank_nfnic_4.0.0.44-0vmw.670.3.104.16075168 cannot be live installed. VIB VMW_bootbank_sfvmk_1.0.0.1003-7vmw.670.3.104.16075168 cannot be live installed. ...
もちろん,Node は Maintenance Mode です.何か嫌な状態になっていそうなので,Node 再起動後に再チャレンジと思ったのですが,ESXi が起動せず(泣笑).OS 用 Disk は RAID1 組んでますが,Console 見てると起動時に Storage Controller の画面を Skip してるようなので,IPMI から覗いてみました.すると案の定 "StorageController0 access degraded or unavailable" と event log に記録されていました.
対象の Controller は Broadcom 3108 で,リアの Hot-Swap ドライブベイに積んだ NAND SSD につながっています.
もう土曜の午後なので,代替パーツは月曜以降でないと入手できなそうだし,このまま 1 Node 停止させて週末を過ごすのも不安だったので,ダメ元で 3108 を引き抜いて差し直してみる事に.
もちろん,ケーブルも一旦抜いてしっかり差し直し.完全に神頼み状態でしたが,なんと無事復活(苦笑).とりあえず今週末は眠れそうです.来週早々予防交換かな?
SMC サーバーは筐体開けると Chassis Intrusion が記録されて,放置していると vCenter に Alarm が出るので,IPMI から必ず Intrusion Reset するのを忘れずに.