- PSoD (Purple Screen Of Death)
우리가 흔히 쓰는 Windows 운영체제에 Blue Screen이 있는 것처럼
ESXi OS에 Purple Screen이 발생하는 것을 PSoD 현상이라고 한다.
PSoD 현상의 이유는 ESXi 내부에 있는 vmkernel에 에러가 발생하기 때문이며
당연히 해당 ESXi에 상주하는 VM도 모두 전원이 내려간다.
vCenter에서 ESXI가 Not Responding 상태라면, PSoD를 의심해봐도 좋다.
해결방안은 원인에 따라 다르며 보통은 Reboot 진행 시 정상 부팅된다.
- vmkernel 이란?
Linux 운영체제에 kernel이 있듯, ESXi에도 vmkernel이 존재한다.
ESXi OS의 마이크로 코어로, VM에 물리 리소스를 추상화하여 할당해주고 디바이스의 I/O를 제어해주는 역할을 수행한다.
간단히 하드웨어의 물리적 리소스를 모두 관리하는 역할이라고 볼 수 있고 ESXi 호스트에서 직접 실행되기 때문에 관련 ESXi/VM 작업이 vmkenrel.log에 기록되는 것이다.
해당 화면처럼 보라색 화면이 발생하고 ESXi는 not responding 상태가 된다.
PSoD 화면은 발생 시에만 뜨기 때문에 꼭 당시 상황에 스크린샷 혹은 사진촬영으로 기록을 남겨야 한다.
거기에 원인, 발생 시 vmkernel의 수행 기록 등이 담겨 있다.
맨 윗줄에는 사용하는 ESXi의 버전과 빌드가 기록되고 그 하단부터 관련된 내용이 기록된다.
자주 보는 내용으로는 예시화면처럼 하드웨어 이슈이다.
마더 보드 이슈로 인해 하드웨어 벤더에 문의하라는 내용이 있듯,
부팅 전에 HW 덤프를 수집해야 하고 필요 시 파트 교체를 하든 조치를 취해야 한다.
하드웨어와 관련된 내용이 아닐 경우, S/W 이슈일 수도 있다.
확인되는 로그 내용에 따라 S/W 패치를 하든 펌웨어 드라이버 업그레이드를 하든 상황에 맞게 조치를 취해야 한다.
PSoD 트러블슈팅 KB
https://kb.vmware.com/s/article/1004250
예시화면 : 마더보드 하드웨어 이슈 KB
https://kb.vmware.com/s/article/1804