RDM이 구성된 환경에서
ESXi를 재부팅하면 Slow Boot 현상이 생길 때가 있다.
나의 경우, RDM이 3개만 존재했고 ESXi Boot 시 약 90분이 소요됐다.
구글링 해보니 3시간 걸린 사례도 많이 볼 수 있었다.
그 땐 RDM을 바라보는 각 ESXi 호스트에 SSH로 접속해서 명령어를 입력하면 해결된다.
~#esxcli storage core device setconfig -d {RDM naa.id} --perennially-reserved=true
RDM으로 VM에 대해 MSCS 혹은 WSFC 환경을 구성하면
MSCS/WSFC는 데이터 손실을 방지하기 위해 SCSI-3 예약을 사용해 노드 간 잠금을 제어한다.
한마디로 호스트가 RDM을 읽을 수 없게 만든다. (물론 인프라 내 인식은 가능)
ESXI는 Boot 과정에서 Stroage rescan을 하기 때문에 읽지 못한 RDM에 대한 시간이 당연히 오래 걸린다.
커널로그 확인해보면 RDM NAAID와 함께 실패하거나 지원하지 않는다는 로그도 확인된다.
위에 적은 명령어를 통해 호스트가 RDM을 스캔할 필요없이 영구적으로 예약한다는 조건을 걸어 (true)
ESXi는 자연스럽게 해당 RDM 스캔을 생략한다.
따라서 Boot 시 혹은 스토리지 rescan 시 시간이 단축될 수 있다.
실제로 해당 명령어를 실행하기 전에 HBA 포트를 절체하고 부팅했을 때에도 부팅이 평소처럼 금방 되었다.
적용 확인 법
~#esxcli storage core device list
.
.
Is Perennially Reserved: true
.
.
만약 RDM이 없는데도 부팅 속도가 느리다면,
iSCSI 네트워크가 불안정하거나 혹은 NFS 데이터스토어가 불안정하거나 혹은 Boot Disk에 문제가 없는지
다양한 가능성을 체크해봐야 한다.