重點關注
NVIDIA
NVIDIA 全產品線、資料中心 GPU 與生態。
相關開源專案 · GITHUB
lightseekorg/tokenspeed★ 1.4k
名為 TokenSpeed 的 GitHub 開源專案主打速度極快的 LLM 推理引擎功能,主要使用的程式語言為 Python。該專案旨在提升模型執行效率,目前正針對 DeepSeek、Kimi、Minimax 等多種模型進行最佳化。
NVIDIA/dgx-spark-playbooks★ 971
NVIDIA 在 GitHub 發布了 dgx-spark-playbooks 開源專案。該專案收錄一系列 Jupyter Notebook,旨在提供在具備 Blackwell 架構的 DGX Spark 裝置上部署 AI/ML 工作負載的詳細設定步驟。
Avarok-Cybersecurity/atlas★ 503
GitHub 開源專案 atlas 是一個純 Rust 推理引擎。該專案約有 503 stars,支援 CUDA、dgx、dgx-spark、gb10 等硬體平臺,主打 LLM 推理,並支援 mamba、nvfp4 等技術,具備 OpenAI API 相容性。
spark-arena/sparkrun★ 338
社群專案 spark-arena/sparkrun 已於 GitHub 開源,提供工具讓開發者能在 NVIDIA DGX Spark 系統上輕鬆部署與管理 LLM 推理工作負載。該專案主要以 Python 撰寫,並針對 Llama.cpp、SGLang 和 vLLM 等框架進行最佳化。
AEON-7/Qwen3.6-27B-AEON-Ultimate-Uncensored-DFlash★ 278
GitHub 新增開源專案 「AEON-7/Qwen3.6-27B-AEON-Ultimate-Uncensored-DFlash」,主打在 **DGX Spark** 或 **Blackwell** 硬體環境下,以 NVFP4 硬體量化技術對 Qwen3.6-27B 模型進行無損擦除(Lossless abliteration)與擴充。專案提供了 BF16 (51 GB) + NVFP4 (26 GB) 的部署指南、docker-compose 配置檔及快速入門指令碼,方便開發者以此提升模型效能。
albond/DGX_Spark_Qwen3.5-122B-A10B-AR-INT4★ 236
GitHub 使用者 albond 公開了一個於 DGX Spark 硬體平臺上執行 Qwen3.5-122B-A10B 模型的最佳化專案。該版本採用 INT4 量化與 MTP 等技術,透過 lossless 量化策略,將單序列推理速度從 28.3 token/s 大幅提升至 51 token/s,增幅達 80%。
natolambert/dgx-spark-setup★ 150
位於 GitHub 的開源專案 natolambert/dgx-spark-setup 提供詳細的設定指南,協助開發者在 NVIDIA DGX Spark 裝置上進行 Machine Learning 訓練。該指南支援最新的 GB10 Blackwell 架構以及 CUDA 13 環境。
Avarok-Cybersecurity/dgx-vllm★ 117
Avarok-Cybersecurity 推出 dgx-vllm 開源專案,致力於建立一個經過最佳化的最新版 vLLM Docker 映像。此團隊以 CUDA 技術為基礎,旨在針對 DGX 硬體平臺提供全面且具備高階效能的支援。
mark-ramsey-ri/vllm-dgx-spark★ 116
一個新的 GitHub 開源專案支援在 1 對 N 的 NVIDIA DGX Spark 伺服器叢集上執行 vLLM。這個工具支援單機、雙機直連或透過 switched fabric 連線多機的部署模式,方便開發者佈署或評測大型語言模型。
全部相關動態 · NVIDIA
02:222NVIDIA 透過 DGX Spark 企業管理功能交付規模化 AI 基礎設施的全生命週期控制確保 AI 系統在企業級部署中達到標準化的營運成熟度,滿足關鍵基礎設施的安全與管理需求。硬體02:212為 AI 工廠設計生產級電池儲能系統隨著 AI 工廠重新定義資料中心基礎設施,電力供應的穩定性與應變能力成為支撐大規模模型訓練與推理的關鍵瓶頸。硬體02:21·NVIDIA 技術文章:如何針對低精度訓練最佳化 Transformer 型號加速 Transformer 訓練不僅是效能最佳化,更是降低算力門檻、縮短研發週期並讓團隊訓練更大規模模型的關鍵。模型02:20·結合 NVIDIA ACE Game Agent SDK 與 Unreal Engine 5 外掛,建置裝置端 AI 伴侶這提供了遊戲開發者高階的整合方案,讓打造兼具高品質畫質與智慧行為的裝置端 AI 互動角色變得更為簡便。工具01:20·Arm 與 NVIDIA 推銷的「AGI CPU」不過是標準處理器的升級版提醒技術決策者,目前的「Agentic CPU」多數只是通用處理器的升級版,選購時應依據實際需求(如頻寬、延遲或多工)來評估,而非被廠商行銷口號誤導。產業01:102SK Telecom 與 NVIDIA 攜手打造韓國千兆瓦級 AI 基礎設施這標誌著韓國通訊產業積極佈局超大規模的 AI 基礎設施建設,為區域 AI 服務提供強大算力支援。產業00:50·HPE AI 工廠擴張以因應智體時代這項合作提供從硬體、軟體到網路的端對端整合解決方案,加速企業從概念驗證(POC)進入生產環境部署長時間運作的智體系統。硬體23:552在 NVIDIA 上執行 DiffusionGemma,打造開發就緒且高吞吐量的文字生成體驗此最佳化能讓開發者更輕鬆地部署高效能的即時 AI 服務。模型23:542NVIDIA Quantum InfiniBand 支援一鍵式多租戶安全配置這項更新顯著簡化了企業高安規性資料中心的多租戶網路設定與部署流程。硬體23:532在 NVIDIA 加速基礎設施上部署 MiniMax M3 的長上下文推理與代理工作流程MiniMax M3 透過單一多模態系統解決了碎片化模型串接的工程痛點,有助於企業簡化架構並加快 AI 應用的迭代速度。模型23:532NVIDIA 於業界首個 Agentic AI 基準測試中展現領先的 Agentic Coding Performance此舉確立了評估 LLM 推論系統在 Agent 應用情境下效能的標準,協助開發者與企業精準選擇硬體解決方案。工具23:512NVIDIA 揭示 VLA 與 WAM 架構推動機器人再進化為具備視覺-語言-行動能力的機器人識別與世界模型的發展奠定架構基礎。模型23:502NVIDIA 透過進階融合 Kernel 提升大規模 MoE 模型訓練吞吐量透過硬體層面的 Kernel 最佳化顯著提升 MoE 模型訓練效率,讓開發者能在有限的算力預算下建置更具規模的高效能模型。硬體23:50·NVIDIA Blackwell 憑藉業界領先的擴充套件性與效能,在 MLPerf Training 6.0 比賽中奪冠Blackwell 的全面勝利再次證明瞭其為訓練密集型任務提供極致效率的硬體實力。硬體23:422NVIDIA 釋出物理 AI 智慧體技能,加速自動駕駛與機器人系統開發這將加速具身 AI 從單一模型生成轉向完整端到端工作流的整合研究,顯著提升自動駕駛安全驗證與機器人實務應用的開發效率。工具23:422NVIDIA 於 CVPR 發布物理 AI 新突破:GraspGen-X 與 NitroGen這些基礎模型與訓練方法的進展,為開發具備通用泛化能力的高科技機器人與自動駕駛汽車奠定了關鍵基礎。研究23:412工業軟體領導者藉助 NVIDIA NemoClaw 與 OpenShell 構建安全自主的 AI 工程師透過在 DGX Spark 等平臺上安全部署具備自主推理能力的 AI 工程師,NEMOClaw 助力產業界將傳統耗時數週的模擬驗證流程縮短至數小時,大幅推動 CAE/EDA 與造船、半導體等硬體領域的數位化轉型。工具23:36·NVIDIA 帶來 GeForce NOW 六月遊戲前瞻,多款新作與《Neverness to Everness》登場透過增加更多高品質雲端遊戲庫,強化了 GeForce NOW 作為雲端串流基礎設施的吸引力,讓玩家無需高規格本地硬體即可暢玩新作。基建23:343NVIDIA 與 KRAFTON、NCsoft、T1 在韓國推廣 RTX Spark,展示高效能與 AI 遊戲體驗RTX Spark 將第二代 Transformer 模型與 DLSS 4.5 light reconstruction 推進到終端使用者的個人裝置,使輕薄機型也能在本地執行高係數的 AI 推理與視覺重建。硬體23:322NVIDIA 與 LG Group 推出 AI 工廠,強化物理 AI 與自動化佈局此次合作將 NVIDIA 的高階軟硬體生態與 LG 全球製造與電子產品領導地位結合,推動物理 AI 與車用自動化的標準化落地。硬體23:322運用 NVIDIA 技術:英國落實主權 AI 的具體行動與佈局這顯示了主權 AI 策略如何透過NVIDIA建置與資助,賦予國家聯盟在關鍵技術領域的自主權。產業23:312NVIDIA 發布 Halos OS 全棧安全系統,強化 Robotaxi 設計與商業化透過提供標準化的安全隔離機制與驗證框架,這套系統解放了 Robotaxis 產業在安全認證上的法律與技術瓶頸,有助於推動實際開放道路營運。硬體23:30·NVIDIA Blackwell 霸氣橫掃 MLPerf Training 6.0,展現最大與最快 AI 訓練實力這些紀錄不僅證明瞭 Blackwell 架構在高效能運算中的優勢,也象徵著訓練龐大前沿模型的時間與成本正在被極致壓縮。硬體22:533NVIDIA Confidential Computing 協助 Apple 擴充套件 Private Cloud Compute在 AI 模式日益重視裝置端與雲端混合運算的時代,匯入具有硬體基礎資安防護的 GPU,是確保敏感資料於雲端運作時不被檢視的關鍵基礎設施轉變。硬體22:523NVIDIA 加速 Google DeepMind DiffusionGemma 模型於本地 AI 執行這項技術突破展示瞭如何在 GPU 上利用計算優勢來大幅降低延遲,為本地低延遲的單使用者應用程式帶來新的部署選擇。模型22:502NVIDIA 推出 GeForce NOW 夏季特賣,12 個月會員最高折 $70這項大幅折扣有效降低了終端使用者嘗試 NVIDIA GeForce NOW Ultimates 的進入門檻,有助於擴大其在雲端遊戲平臺的市場佔有率與使用率。基建22:50·非 x86 伺服器市佔率首度突破 4 成,基於 ARM 的 AI 系統成長 107%非 x86 伺服器市佔率的顯著提升,標誌著在 AI 基礎設施推動下,x86 主導的資料中心硬體架構正經歷長達二十年的首次結構性改變。產業22:482NVIDIA 宣佈 2026 年股東大會將於 6 月 24 日舉行,開放個別股東線上參加作為資本市場關注的焦點,股東會的召開時程與提議案將反映 NVIDIA 對未來營運規劃的態度,影響投資人對 AI 硬體產業的預期。產業21:382LF AI 基金會推動 DocLang,打造專為 LLM 解析設計的檔案格式標準透過標準化檔案格式,企業可有效降低 LLM 處理檔案的 token 消耗成本並提升解析準確度。工具21:362Arm 晶片加速雲端 AI 轉型,升級至 Neoverse 架構以追求效率這對產業代表著資料中心硬體設計的重組,越來越多組織將透過 Neoverse 搭配專屬矽晶片來滿足 AI 的能效與成本要求。晶片21:152NVIDIA 與鬥山集團合作,推動物理 AI 與 AI 工廠基建生態此合作將 AI 軟硬體生態從計算核心向外擴充套件至電力基礎設施與電子材料,有助於解決 AI 工廠實際部署中關鍵的能源穩定性與連線性瓶頸。硬體21:142SK 電訊攜手 NVIDIA 建置吉瓦級 AI 雲,設定首座 AI 工廠以服務亞洲市場此次合作展示電信網路正逐步轉型成為國家級 AI 基礎設施的關鍵樞紐,為企業提供從晶片到電力網整合的高效能算力支援。基建21:122NAVER 與 NVIDIA 合作擴充套件 AI 基礎設施,滿足全球激增 AI 需求此合作樹立了亞洲企業運用 NVIDIA DSX 建立資料主權的典範,並驗證了軟體最佳化在提升 AI 工廠 Token 效能與營運規模上的實際商業價值。基建21:112NVIDIA 與 SK 海力士達成多年合作,聯手推進 AI 工廠記憶體技術此合作確保了下一代 AI 工廠所需的關鍵記憶體供給,並透過 AI 數字孿生技術革新半導體製造流程,強化產業供應鏈韌性。硬體21:10·如視匯入 NVIDIA Jetson,實現毫米級邊緣端三維重建如視的邊緣裝置與 NVIDIA Omniverse 的整合,將「掃描」直接轉化為機器人可互動的數位資產,滿足具身智慧發展對高保真真實場景資料的殷切需求。硬體20:50·華碩 ExpertCenter Pro ET900N G3 搭載 NVIDIA Grace Blackwell Ultra顯示 NVIDIA Grace Blackwell Ultra 技術正快速普及至商用工作站領域。硬體20:50·AMD 發布小型 AI 桌上型電腦,直接挑戰 NVIDIA 的 DGX Spark此發布將加劇 AI 運算裝置市場的競爭,為需要緊湊型解決方案的開發者提供 NVIDIA 以外的另一種選擇。硬體20:21·Acer 推出 RTX 5090 遊戲筆電優惠價格這對於尋求具備高算力 GPU 硬體的開發者與重度遊戲使用者而言,提供了一個具備成本效益的企業級升級選擇。硬體19:40·Nvidia 的 RTX Spark 正以不同名稱推出,已能順利執行《Cyberpunk 2077》透過實際遊玩範例展示了重新命名後的 Nvidia GPU 擁有強勁的圖形處理能力,驗證了硬體效能。硬體18:25·Nvidia 推出 RTX Spark 處理器 研究分析 Microsoft Project Solara Android 計畫這顯示了個人電腦市場的硬體生態將從「裝載模型的作業系統」轉向以「執行 Agents 的運算晶片」為主,Nvidia 與微軟正分別試圖透過專用 GPU 與 Android 平臺來重新定義未來 AI 裝置的靈活性與生態圈。硬體18:23·Google 向 SpaceX 採購運算資源,Broadcom 前景與 Apple 的 AI 政治立場顯示了 AI 供應鏈對 NVIDIA 硬體的關鍵角色,以及大型科技公司間在硬體供應與策略佈局上的連動性。硬體14:31·AMD 推出 $3999「Halo」機臺挑戰 NVIDIA DGX Spark,主打 128GB 記憶體與 Zen 5 AI 針對能力這款硬體的推出為企業級 AI 運算市場帶來新的競爭選項,迫使開發者與決策者在評估 GPU 解決方案時,重新檢視 AMD 產品的價值。硬體14:31·NVIDIA 推出配備 Grace Blackwell 超級晶片的 RTX Spark 筆記型電腦這是 Grace Blackwell 架構首次落地於 PC 裝置,代表頂級 AI 計算能力開始向移動端應用。硬體14:30·在 NVIDIA 上執行 DiffusionGemma,打造具備開發者友善與高吞吐量的文字生成環境協助開發者降低在 NVIDIA 架構上部署 DiffusionGemma 的門檻,並最大化推理效能。工具14:30·MediaTek 與 NVIDIA 討論 DGX Spark這項發布將高算力的 AI 超級電腦微型化至桌機等級,未來個人開發者或許能在桌上直接執行大型的語言模型。硬體14:30·大算力叢集小耗電:8x NVIDIA GB10 叢集展示了低功耗、高效率的 SoC 晶片在集中式 AI 推理場景中具備極高的應用潛力。硬體13:15·華碩推出配備 748 GB 記憶體與 Nvidia GB300 的電腦,售價 9.9 萬美元具備高容量記憶體與頂級 GPU 組合的機種,滿足專業運算與圖形處理領域對極致效能的需求。硬體13:14·Dell Pro Max GB10 評測:檢視 NVIDIA 迷你 AI 超級電腦提供了一個可驗證的高價效比硬體選項,讓企業與開發者能在邊緣環境部署 AI 力量。硬體13:14·AMD 推出 128GB 記憶體版 Ryzen AI Halo 以挑戰 NVIDIA 的 DGX Spark:價格僅 $3999,目標直指高速 LLM 運算打破了 NVIDIA 在高階 AI PC 領域的壟斷,AMD 提供了更經濟實惠的高記憶體硬體選擇,降低開發者部署本地 LLM 的門檻。硬體13:12·NVIDIA 推出 DGX Spark 企業管理功能,強化 AI 基礎設施生命週期控管此功能將協助大型機構在擴大 AI 運算規模時,簡化基礎設施的維護與管理流程。硬體