Cloudflare 修復 firmware 問題,將核心伺服器開機時間從數小時回歸數分鐘
為何重要
對於管理裸金屬伺服器基礎設施的工程團隊而言,這提供了關於最佳化 UEFI 和 iPXE 網路開機順序以提升系統可靠性與部署效率的寶貴實務經驗。
Cloudflare 報導指出,一輪 firmware 更新後,核心伺服器的啟動程式異常拖延。經檢查發現問題出在伺服器盲目輪詢網路開機介面,必須經過多次 IPv4iPXE 和 iPXE 失敗嘗試後,才會轉向成功的 IPv6 HTTPS 介面。工程團隊透過在 iPXE 指令碼中明確宣告正確的網路開機介面,成功消除了無效的等待時間,將開機與升級流程恢復到數分鐘。