重點關注

NVIDIA

NVIDIA 全產品線、資料中心 GPU 與生態。

78 則相關動態 · 9 個開源專案 · 即時匯整

相關開源專案 · GITHUB

lightseekorg/tokenspeed★ 1.4k

名為 TokenSpeed 的 GitHub 開源專案主打速度極快的 LLM 推理引擎功能，主要使用的程式語言為 Python。該專案旨在提升模型執行效率，目前正針對 DeepSeek、Kimi、Minimax 等多種模型進行最佳化。

Pythonblackwelldeepseekgpt-oss

NVIDIA/dgx-spark-playbooks★ 971

NVIDIA 在 GitHub 發布了 dgx-spark-playbooks 開源專案。該專案收錄一系列 Jupyter Notebook，旨在提供在具備 Blackwell 架構的 DGX Spark 裝置上部署 AI/ML 工作負載的詳細設定步驟。

Jupyter Notebook

Avarok-Cybersecurity/atlas★ 503

GitHub 開源專案 atlas 是一個純 Rust 推理引擎。該專案約有 503 stars，支援 CUDA、dgx、dgx-spark、gb10 等硬體平臺，主打 LLM 推理，並支援 mamba、nvfp4 等技術，具備 OpenAI API 相容性。

Rustcudadgxdgx-spark

spark-arena/sparkrun★ 338

社群專案 spark-arena/sparkrun 已於 GitHub 開源，提供工具讓開發者能在 NVIDIA DGX Spark 系統上輕鬆部署與管理 LLM 推理工作負載。該專案主要以 Python 撰寫，並針對 Llama.cpp、SGLang 和 vLLM 等框架進行最佳化。

Pythondgx-sparkinferencellama-cpp

AEON-7/Qwen3.6-27B-AEON-Ultimate-Uncensored-DFlash★ 278

GitHub 新增開源專案「AEON-7/Qwen3.6-27B-AEON-Ultimate-Uncensored-DFlash」，主打在 **DGX Spark** 或 **Blackwell** 硬體環境下，以 NVFP4 硬體量化技術對 Qwen3.6-27B 模型進行無損擦除（Lossless abliteration）與擴充。專案提供了 BF16 (51 GB) + NVFP4 (26 GB) 的部署指南、docker-compose 配置檔及快速入門指令碼，方便開發者以此提升模型效能。

albond/DGX_Spark_Qwen3.5-122B-A10B-AR-INT4★ 236

GitHub 使用者 albond 公開了一個於 DGX Spark 硬體平臺上執行 Qwen3.5-122B-A10B 模型的最佳化專案。該版本採用 INT4 量化與 MTP 等技術，透過 lossless 量化策略，將單序列推理速度從 28.3 token/s 大幅提升至 51 token/s，增幅達 80%。

Pythonautoroundcudadgx-spark

natolambert/dgx-spark-setup★ 150

位於 GitHub 的開源專案 natolambert/dgx-spark-setup 提供詳細的設定指南，協助開發者在 NVIDIA DGX Spark 裝置上進行 Machine Learning 訓練。該指南支援最新的 GB10 Blackwell 架構以及 CUDA 13 環境。

Avarok-Cybersecurity/dgx-vllm★ 117

Avarok-Cybersecurity 推出 dgx-vllm 開源專案，致力於建立一個經過最佳化的最新版 vLLM Docker 映像。此團隊以 CUDA 技術為基礎，旨在針對 DGX 硬體平臺提供全面且具備高階效能的支援。

mark-ramsey-ri/vllm-dgx-spark★ 116

一個新的 GitHub 開源專案支援在 1 對 N 的 NVIDIA DGX Spark 伺服器叢集上執行 vLLM。這個工具支援單機、雙機直連或透過 switched fabric 連線多機的部署模式，方便開發者佈署或評測大型語言模型。

全部相關動態 · NVIDIA

02:222NVIDIA 透過 DGX Spark 企業管理功能交付規模化 AI 基礎設施的全生命週期控制確保 AI 系統在企業級部署中達到標準化的營運成熟度，滿足關鍵基礎設施的安全與管理需求。NVIDIA Technical Blog · 42 分鐘前NVIDIADGX SparkEnterprise Manageability硬體 02:212為 AI 工廠設計生產級電池儲能系統隨著 AI 工廠重新定義資料中心基礎設施，電力供應的穩定性與應變能力成為支撐大規模模型訓練與推理的關鍵瓶頸。NVIDIA Technical Blog · 42 分鐘前NVIDIAAI factoriesBattery Energy Storage硬體 02:21·NVIDIA 技術文章：如何針對低精度訓練最佳化 Transformer 型號加速 Transformer 訓練不僅是效能最佳化，更是降低算力門檻、縮短研發週期並讓團隊訓練更大規模模型的關鍵。NVIDIA Technical Blog · 43 分鐘前NVIDIATransformer低精度訓練模型 02:20·結合 NVIDIA ACE Game Agent SDK 與 Unreal Engine 5 外掛，建置裝置端 AI 伴侶這提供了遊戲開發者高階的整合方案，讓打造兼具高品質畫質與智慧行為的裝置端 AI 互動角色變得更為簡便。NVIDIA Technical Blog · 44 分鐘前NVIDIAUnreal EngineRTX工具 01:20·Arm 與 NVIDIA 推銷的「AGI CPU」不過是標準處理器的升級版提醒技術決策者，目前的「Agentic CPU」多數只是通用處理器的升級版，選購時應依據實際需求（如頻寬、延遲或多工）來評估，而非被廠商行銷口號誤導。The Register · 1 小時前NVIDIAArmAGI CPU產業 01:102SK Telecom 與 NVIDIA 攜手打造韓國千兆瓦級 AI 基礎設施這標誌著韓國通訊產業積極佈局超大規模的 AI 基礎設施建設，為區域 AI 服務提供強大算力支援。NVIDIA Newsroom · 1 小時前NVIDIASK TelecomAI Cloud產業 00:50·HPE AI 工廠擴張以因應智體時代這項合作提供從硬體、軟體到網路的端對端整合解決方案，加速企業從概念驗證（POC）進入生產環境部署長時間運作的智體系統。NVIDIA Blog · 2 小時前HPENVIDIAAgents硬體 23:552在 NVIDIA 上執行 DiffusionGemma，打造開發就緒且高吞吐量的文字生成體驗此最佳化能讓開發者更輕鬆地部署高效能的即時 AI 服務。NVIDIA Technical Blog · 3 小時前DiffusionGemmaGoogle DeepMindNVIDIA模型 23:542NVIDIA Quantum InfiniBand 支援一鍵式多租戶安全配置這項更新顯著簡化了企業高安規性資料中心的多租戶網路設定與部署流程。NVIDIA Technical Blog · 3 小時前NVIDIAQuantum InfiniBandUFM硬體 23:532在 NVIDIA 加速基礎設施上部署 MiniMax M3 的長上下文推理與代理工作流程MiniMax M3 透過單一多模態系統解決了碎片化模型串接的工程痛點，有助於企業簡化架構並加快 AI 應用的迭代速度。NVIDIA Technical Blog · 3 小時前MiniMaxM3NVIDIA Blackwell模型 23:532NVIDIA 於業界首個 Agentic AI 基準測試中展現領先的 Agentic Coding Performance此舉確立了評估 LLM 推論系統在 Agent 應用情境下效能的標準，協助開發者與企業精準選擇硬體解決方案。NVIDIA Technical Blog · 3 小時前NVIDIAArtificial AnalysisAA-AgentPerf工具 23:512NVIDIA 揭示 VLA 與 WAM 架構推動機器人再進化為具備視覺-語言-行動能力的機器人識別與世界模型的發展奠定架構基礎。NVIDIA Technical Blog · 3 小時前NVIDIAVLAWAM模型 23:502NVIDIA 透過進階融合 Kernel 提升大規模 MoE 模型訓練吞吐量透過硬體層面的 Kernel 最佳化顯著提升 MoE 模型訓練效率，讓開發者能在有限的算力預算下建置更具規模的高效能模型。NVIDIA Technical Blog · 3 小時前NVIDIAMoEFusion Kernels硬體 23:50·NVIDIA Blackwell 憑藉業界領先的擴充套件性與效能，在 MLPerf Training 6.0 比賽中奪冠Blackwell 的全面勝利再次證明瞭其為訓練密集型任務提供極致效率的硬體實力。NVIDIA Technical Blog · 3 小時前NVIDIABlackwellMLPerf Training 6.0硬體 23:422NVIDIA 釋出物理 AI 智慧體技能，加速自動駕駛與機器人系統開發這將加速具身 AI 從單一模型生成轉向完整端到端工作流的整合研究，顯著提升自動駕駛安全驗證與機器人實務應用的開發效率。NVIDIA 英偉達博客 · 3 小時前NVIDIACosmos 3Isaac Sim工具 23:422NVIDIA 於 CVPR 發布物理 AI 新突破：GraspGen-X 與 NitroGen這些基礎模型與訓練方法的進展，為開發具備通用泛化能力的高科技機器人與自動駕駛汽車奠定了關鍵基礎。NVIDIA 英偉達博客 · 3 小時前NVIDIACVPRGraspGen-X研究 23:412工業軟體領導者藉助 NVIDIA NemoClaw 與 OpenShell 構建安全自主的 AI 工程師透過在 DGX Spark 等平臺上安全部署具備自主推理能力的 AI 工程師，NEMOClaw 助力產業界將傳統耗時數週的模擬驗證流程縮短至數小時，大幅推動 CAE/EDA 與造船、半導體等硬體領域的數位化轉型。NVIDIA 英偉達博客 · 3 小時前NVIDIANemoClawOpenShell工具 23:36·NVIDIA 帶來 GeForce NOW 六月遊戲前瞻，多款新作與《Neverness to Everness》登場透過增加更多高品質雲端遊戲庫，強化了 GeForce NOW 作為雲端串流基礎設施的吸引力，讓玩家無需高規格本地硬體即可暢玩新作。NVIDIA Blog · 3 小時前NVIDIAGeForce NOWCloud Gaming基建 23:343NVIDIA 與 KRAFTON、NCsoft、T1 在韓國推廣 RTX Spark，展示高效能與 AI 遊戲體驗RTX Spark 將第二代 Transformer 模型與 DLSS 4.5 light reconstruction 推進到終端使用者的個人裝置，使輕薄機型也能在本地執行高係數的 AI 推理與視覺重建。NVIDIA 英偉達博客 · 3 小時前NVIDIARTX SparkDLSS 4.5硬體 23:322NVIDIA 與 LG Group 推出 AI 工廠，強化物理 AI 與自動化佈局此次合作將 NVIDIA 的高階軟硬體生態與 LG 全球製造與電子產品領導地位結合，推動物理 AI 與車用自動化的標準化落地。NVIDIA Blog · 3 小時前NVIDIALG GroupAI Factory硬體 23:322運用 NVIDIA 技術：英國落實主權 AI 的具體行動與佈局這顯示了主權 AI 策略如何透過NVIDIA建置與資助，賦予國家聯盟在關鍵技術領域的自主權。NVIDIA Blog · 3 小時前NVIDIAUnited KingdomSovereign AI產業 23:312NVIDIA 發布 Halos OS 全棧安全系統，強化 Robotaxi 設計與商業化透過提供標準化的安全隔離機制與驗證框架，這套系統解放了 Robotaxis 產業在安全認證上的法律與技術瓶頸，有助於推動實際開放道路營運。NVIDIA Blog · 3 小時前NVIDIAHalos OSRobotaxis硬體 23:30·NVIDIA Blackwell 霸氣橫掃 MLPerf Training 6.0，展現最大與最快 AI 訓練實力這些紀錄不僅證明瞭 Blackwell 架構在高效能運算中的優勢，也象徵著訓練龐大前沿模型的時間與成本正在被極致壓縮。NVIDIA Blog · 3 小時前NVIDIABlackwellGB200 NVL72硬體 22:533NVIDIA Confidential Computing 協助 Apple 擴充套件 Private Cloud Compute在 AI 模式日益重視裝置端與雲端混合運算的時代，匯入具有硬體基礎資安防護的 GPU，是確保敏感資料於雲端運作時不被檢視的關鍵基礎設施轉變。NVIDIA Blog · 4 小時前NVIDIAAppleConfidential Computing硬體 22:523NVIDIA 加速 Google DeepMind DiffusionGemma 模型於本地 AI 執行這項技術突破展示瞭如何在 GPU 上利用計算優勢來大幅降低延遲，為本地低延遲的單使用者應用程式帶來新的部署選擇。NVIDIA Blog · 4 小時前DiffusionGemmaGoogle DeepMindNVIDIA模型 22:502NVIDIA 推出 GeForce NOW 夏季特賣，12 個月會員最高折 $70這項大幅折扣有效降低了終端使用者嘗試 NVIDIA GeForce NOW Ultimates 的進入門檻，有助於擴大其在雲端遊戲平臺的市場佔有率與使用率。NVIDIA Newsroom · 4 小時前NVIDIAGeForce NOW雲端遊戲基建 22:50·非 x86 伺服器市佔率首度突破 4 成，基於 ARM 的 AI 系統成長 107%非 x86 伺服器市佔率的顯著提升，標誌著在 AI 基礎設施推動下，x86 主導的資料中心硬體架構正經歷長達二十年的首次結構性改變。The Register · 4 小時前IntelAMDNvidia產業 22:482NVIDIA 宣佈 2026 年股東大會將於 6 月 24 日舉行，開放個別股東線上參加作為資本市場關注的焦點，股東會的召開時程與提議案將反映 NVIDIA 對未來營運規劃的態度，影響投資人對 AI 硬體產業的預期。NVIDIA Newsroom · 4 小時前NVIDIA股東大會投資人產業 21:382LF AI 基金會推動 DocLang，打造專為 LLM 解析設計的檔案格式標準透過標準化檔案格式，企業可有效降低 LLM 處理檔案的 token 消耗成本並提升解析準確度。The Register · 5 小時前DocLangLLMtokens工具 21:362Arm 晶片加速雲端 AI 轉型，升級至 Neoverse 架構以追求效率這對產業代表著資料中心硬體設計的重組，越來越多組織將透過 Neoverse 搭配專屬矽晶片來滿足 AI 的能效與成本要求。The Register · 5 小時前ArmNeoverseHyperscalers晶片 21:152NVIDIA 與鬥山集團合作，推動物理 AI 與 AI 工廠基建生態此合作將 AI 軟硬體生態從計算核心向外擴充套件至電力基礎設施與電子材料，有助於解決 AI 工廠實際部署中關鍵的能源穩定性與連線性瓶頸。NVIDIA 英偉達博客 · 5 小時前NVIDIA鬥山集團物理AI硬體 21:142SK 電訊攜手 NVIDIA 建置吉瓦級 AI 雲，設定首座 AI 工廠以服務亞洲市場此次合作展示電信網路正逐步轉型成為國家級 AI 基礎設施的關鍵樞紐，為企業提供從晶片到電力網整合的高效能算力支援。NVIDIA 英偉達博客 · 5 小時前SK 電訊NVIDIADSX基建 21:122NAVER 與 NVIDIA 合作擴充套件 AI 基礎設施，滿足全球激增 AI 需求此合作樹立了亞洲企業運用 NVIDIA DSX 建立資料主權的典範，並驗證了軟體最佳化在提升 AI 工廠 Token 效能與營運規模上的實際商業價值。NVIDIA 英偉達博客 · 5 小時前NVIDIANAVERDSX基建 21:112NVIDIA 與 SK 海力士達成多年合作，聯手推進 AI 工廠記憶體技術此合作確保了下一代 AI 工廠所需的關鍵記憶體供給，並透過 AI 數字孿生技術革新半導體製造流程，強化產業供應鏈韌性。NVIDIA 英偉達博客 · 5 小時前NVIDIASK海力士AI工廠硬體 21:10·如視匯入 NVIDIA Jetson，實現毫米級邊緣端三維重建如視的邊緣裝置與 NVIDIA Omniverse 的整合，將「掃描」直接轉化為機器人可互動的數位資產，滿足具身智慧發展對高保真真實場景資料的殷切需求。NVIDIA 英偉達博客 · 5 小時前NVIDIAJetson邊緣 AI硬體 20:50·華碩 ExpertCenter Pro ET900N G3 搭載 NVIDIA Grace Blackwell Ultra顯示 NVIDIA Grace Blackwell Ultra 技術正快速普及至商用工作站領域。DGX Spark 新聞 (Google News) · 6 小時前ASUSNVIDIAGrace Blackwell Ultra硬體 20:50·AMD 發布小型 AI 桌上型電腦，直接挑戰 NVIDIA 的 DGX Spark此發布將加劇 AI 運算裝置市場的競爭，為需要緊湊型解決方案的開發者提供 NVIDIA 以外的另一種選擇。DGX Spark 新聞 (Google News) · 6 小時前AMDNVIDIADGX Spark硬體 20:21·Acer 推出 RTX 5090 遊戲筆電優惠價格這對於尋求具備高算力 GPU 硬體的開發者與重度遊戲使用者而言，提供了一個具備成本效益的企業級升級選擇。Tom's Hardware · 6 小時前AcerPredator Helios AIRTX 5090硬體 19:40·Nvidia 的 RTX Spark 正以不同名稱推出，已能順利執行《Cyberpunk 2077》透過實際遊玩範例展示了重新命名後的 Nvidia GPU 擁有強勁的圖形處理能力，驗證了硬體效能。DGX Spark 新聞 (Google News) · 7 小時前NvidiaRTX SparkCyberpunk 2077硬體 18:25·Nvidia 推出 RTX Spark 處理器研究分析 Microsoft Project Solara Android 計畫這顯示了個人電腦市場的硬體生態將從「裝載模型的作業系統」轉向以「執行 Agents 的運算晶片」為主，Nvidia 與微軟正分別試圖透過專用 GPU 與 Android 平臺來重新定義未來 AI 裝置的靈活性與生態圈。Stratechery · 8 小時前nvidiamicrosoftrtx-spark硬體 18:23·Google 向 SpaceX 採購運算資源，Broadcom 前景與 Apple 的 AI 政治立場顯示了 AI 供應鏈對 NVIDIA 硬體的關鍵角色，以及大型科技公司間在硬體供應與策略佈局上的連動性。Stratechery · 8 小時前GoogleSpaceXBroadcom硬體 14:31·AMD 推出 $3999「Halo」機臺挑戰 NVIDIA DGX Spark，主打 128GB 記憶體與 Zen 5 AI 針對能力這款硬體的推出為企業級 AI 運算市場帶來新的競爭選項，迫使開發者與決策者在評估 GPU 解決方案時，重新檢視 AMD 產品的價值。DGX Spark 新聞 (Google News) · 12 小時前AMDNVIDIADGX Spark硬體 14:31·NVIDIA 推出配備 Grace Blackwell 超級晶片的 RTX Spark 筆記型電腦這是 Grace Blackwell 架構首次落地於 PC 裝置，代表頂級 AI 計算能力開始向移動端應用。DGX Spark 新聞 (Google News) · 12 小時前NVIDIAGrace BlackwellRTX Spark硬體 14:30·在 NVIDIA 上執行 DiffusionGemma，打造具備開發者友善與高吞吐量的文字生成環境協助開發者降低在 NVIDIA 架構上部署 DiffusionGemma 的門檻，並最大化推理效能。DGX Spark 新聞 (Google News) · 12 小時前NVIDIADiffusionGemmaText Generation工具 14:30·MediaTek 與 NVIDIA 討論 DGX Spark這項發布將高算力的 AI 超級電腦微型化至桌機等級，未來個人開發者或許能在桌上直接執行大型的語言模型。DGX Spark 新聞 (Google News) · 12 小時前NVIDIAMediaTekDGX Spark硬體 14:30·大算力叢集小耗電：8x NVIDIA GB10 叢集展示了低功耗、高效率的 SoC 晶片在集中式 AI 推理場景中具備極高的應用潛力。DGX Spark 新聞 (Google News) · 12 小時前NVIDIAGB10AI Cluster硬體 13:15·華碩推出配備 748 GB 記憶體與 Nvidia GB300 的電腦，售價 9.9 萬美元具備高容量記憶體與頂級 GPU 組合的機種，滿足專業運算與圖形處理領域對極致效能的需求。DGX Spark 新聞 (Google News) · 13 小時前AsusNvidiaGB300硬體 13:14·Dell Pro Max GB10 評測：檢視 NVIDIA 迷你 AI 超級電腦提供了一個可驗證的高價效比硬體選項，讓企業與開發者能在邊緣環境部署 AI 力量。DGX Spark 新聞 (Google News) · 13 小時前DellNVIDIAGB10硬體 13:14·AMD 推出 128GB 記憶體版 Ryzen AI Halo 以挑戰 NVIDIA 的 DGX Spark：價格僅 $3999，目標直指高速 LLM 運算打破了 NVIDIA 在高階 AI PC 領域的壟斷，AMD 提供了更經濟實惠的高記憶體硬體選擇，降低開發者部署本地 LLM 的門檻。DGX Spark 新聞 (Google News) · 13 小時前AMDNVIDIARyzen AI Halo硬體 13:12·NVIDIA 推出 DGX Spark 企業管理功能，強化 AI 基礎設施生命週期控管此功能將協助大型機構在擴大 AI 運算規模時，簡化基礎設施的維護與管理流程。DGX Spark 新聞 (Google News) · 13 小時前NVIDIADGX SparkEnterprise Manageability硬體