Cloudflare 徵集 Ensemble AI 團隊,強化高效 AI 推理基礎設施
為何重要
此舉讓 Cloudflare 能結合原創的模型壓縮技術與全球網路,提供更高效、低成本的 AI 推理服務,有助於開發者打破部署門檻以執行更龐大的大規模工作負載。
Cloudflare 正徵集 Ensemble AI 的核心成員,以加強其 AI 基礎設施並讓開發者更有效率地在全球網路上部署強大的模型。Ensemble AI 專注於降低大型語言模型的記憶體、運算和部署成本,並開發了 NdLinear 和 NdLinear-LoRA 等模型壓縮技術。此次合作將與 Cloudflare 現有的 Workers AI 和 Infire 結合,進一步最佳化 serverless GPU 推理的經濟性與效能。