ai.doge.tg 繁體 AI 情報 最新 專案 搜尋 Telegram ↗

使用 NVFP4 與 NVIDIA Blackwell 透過 JAX 和 MaxText 加速模型訓練

硬體 1 個來源 · 2 天前
為何重要

解決了低位混合精度訓練的技術難題,有助於開發者降低大規模 LLM 預訓練的計算成本與時間。

為瞭解決前緣大語言模型訓練中並行運算的吞吐量問題,NVIDIA 介紹了使用 NVFP4 與 NVIDIA Blackwell 的低-位混合精度預訓練方法,這能透過 JAX 和 MaxText 結合顯著縮短大量加速器上的訓練時間。

NVIDIABlackwellNVFP4JAXMaxTextLLM

來源 · 1 篇報導

首發 NVIDIA Technical Blog developer.nvidia.com 02:18