重點關注
Hugging Face
Hugging Face 模型、論文與生態。
全部相關動態 · HUGGING FACE
02:1121Hugging Face 新釋出模型 zai-org/GLM-5.1-FP8提供具備 FP8 儲存特性與 MoE 架構的完整權重釋出,降低開發者進行模型部署與微調的門檻與成本。模型00:4510新模型釋出:Moonshot AI 釋出 Kimi-K2.6鞏固了 Moonshot 在多模態與視覺語言模型領域的技術實力,為全球開發者提供了一個服務強勁的影像理解對話模型。中國00:442Kimi 發布代號 K2.7-Code 模型代表 Moonshot AI 在開源程式碼生成與多模態能力的佈局。模型00:3312Hugging Face 新增 DeepSeek-V4-Pro-Base 模型代表 DeepSeek-V4 系列的最新進展,為開發者提供了另一個額外的預訓練基礎模型,並展示了該社群對 FP8 機器學習技術的持續應用。模型00:314DeepSeek 釋出 DeepSeek-OCR-2 模型為需要檔案解析或多語言視覺理解的開發者提供了另一個高效能的 OCR 端點選擇。模型23:442Hugging Face 新釋出模型 zai-org/RealVideo這款採用 MIT 授權的開源模型提供 14B 級別的視訊生成能力,適合開發者與研究人員探索通用視訊處理的應用。模型22:523NVIDIA 加速 Google DeepMind DiffusionGemma 模型於本地 AI 執行這項技術突破展示瞭如何在 GPU 上利用計算優勢來大幅降低延遲,為本地低延遲的單使用者應用程式帶來新的部署選擇。模型22:302Hugging Face 新增角色動畫影像轉影片模型 zai-org/SCAIL-2儘管目前下載量為零,但獲得高達 186 個點贊,顯示該模型在角色動畫影片生成領域受到社群矚目。模型22:012DeepSeek 在 Hugging Face 上發布 DeepSeek-V4-Flash-Base 模型提供開發者可直接在 HF 生態中下載的快速推理基礎模型,有利於推動低延遲應用的開發。模型22:014DeepSeek 發表 V4 Flash 模型,支援註冊於 Hugging Face為開發者提供具備高效能與迷你的 V4 推理方案,且符合開源授權。模型15:30·誰會翻盤?自我與跨模型反駁揭露 LLM 答案不穩性為 AI 可靠性評估提供了關鍵的新指標,揭示模型在互動情境下的思維不穩定問題。研究14:10·網頁代理的錯誤歸因?引入語義狀態追蹤的過程層級評估基準 WebStep提供比單一成功率更細緻的過程視角,精準定位代理在網頁操作的具體弱點並提供可操作的改進建議。工具13:24·資料記者 Agent:將資料轉化為可驗證的多模態故事Data2Story 強化了大語言模型的事實查核與多模態生成能力,為新聞產業提供了一個能生成透明、可驗證且具互動性報導的協作工具。工具13:24·JoyAI-VL-Interaction:即時視覺語言互動智慧模型這是首個同步開放訓練配方、資料與完整部署系統的視覺驅動互動模型,對開發者建構即時 AI Agent 提供了極具參考價值的開源範本。工具13:22·AI 指數報告 2026(第九版)提供了衡量 AI 前沿安全測試與經濟影響的關鍵現狀,協助產業界與政策制定者掌握治理缺口。研究12:03·Retrieval 化繁為簡:讓 Vision-Language-Action 模型在測試時擴充套件至新任務透過「先取樣後調整引數」的策略,開發者無需為每個新任務進行昂貴的微調,大幅提升了機器人策略部署的彈性與效率。研究12:02·BRDFusion:物理模型與生成式 AI 結合,實現高品質都市場景逆渲染該技術結合物理準確度與生成式先驗,為內容創作與自駕車模擬提供兼具還原度與可控性的新解決方案。研究12:01·OneRank:統一的 Transformer 原生多工推薦架構OneRank 解決了現代 Transformer 推薦架構因編碼器與預測器分離所導致的效能與擴充套件性限制,為統一的多工學習架構提供了新的可能性。研究12:01·Nemotron 3 Ultra:開源、高效能混合 MoE 與 Mamba-Transformer 模型為長時間執行的自主代理任務提供了兼具高推理吞吐量與開源生態的強大模型解決方案。模型04:14·不需要隱藏提示!僅靠呈現式修訂即可「操控」AI 同行評審揭露了自動化同行評審系統潛藏的重大誤判風險,指出學術界佈署 AI 審核可能導致「形式勝於內容」的決策失誤。研究01:527Hugging Face 新模型發布:Qwen/SAE-Res-Qwen3.5-35B-A3B-Base-W128K-L0_100這個工具賦予開發者與研究人員深入剖析大型語言模型內部世界中能力,推動 AI 系統可解釋性的發展。模型01:30·人工推理之謎:探究大型推理模型的「生產-評估」差距該研究確立了當前大型推理模型在效能評估上的關鍵缺陷,強調未來模型開發必須將嚴謹的邏輯驗證能力納入訓練與評估指標。研究00:32·Kimi-Linear-48B-A3B-Instruct 模型發布為開發者提供一個具備實戰意義、MIT 授權的對話模型參考範式。模型00:31·Moonshot AI 釋出 Kimi-Linear-48B-A3B-Base 模型為 Kimi 生態提供具備強大對話與程式碼能力的開源模型權重選擇。模型21:532Hugging Face 新模型釋出:Qwen/SAE-Res-Qwen3.5-35B-A3B-Base-W32K-L0_50此類可解釋性工具的開放,對於開發者深入理解大型語言模型內部啟用機制的運作原理至關重要。研究21:50·Qwen 釋出影像評測模型 Qwen/Qwen-Image-Bench提供了一個可自動化評估影像生成效果的工具,有助於開發者提升模型訓練與評測的效率。模型21:45·PyTorch 效能剖析(第二篇):從 nn.Linear 至 Fused MLP此最佳化技巧能幫助開發者在維護與部署模型時顯著降低資源成本,提升在地端執行的整體效能表現。工具21:44·Hugging Face 發布 olmo-eval:專為模型開發迴圈設計的評估工作臺提供強大的開源評估座臺,加速開發者最佳化模型訓練流程並確保模型品質。工具