ai.doge.tg 繁體 AI 情報 最新 專案 搜尋 Telegram ↗

現況世界模型缺乏持有觀測的持久核心狀態

研究 1 個來源 · 2 小時前
為何重要

這項研究揭露了當前多模態世界模型評估的盲點:業界過度獎勵影像畫質與操控性,卻忽略了物理邏輯的時間連續性。對開發者而言,這意味著具備 AGI 特性的系統架構必須強制加入解決「視線脫離後停止思考」問題的模組。對投資人來說,這區分了目前市場熱門的視覺生成技術與真正具備環境模擬能力的硬科技產品之間的鴻溝。

世界模型雖被視為通往通用人工智慧 (AGI) 的重要橋樑,但現有技術缺乏能模擬物理世界隨時間獨立演化的內部狀態核心。研究者提出 WRBench,首度將鏡頭運動視為幹預觀測的手段,系統性評估模型在無人觀測時的運作邏輯。

  • 評估基準涵蓋 9,600 部影片,基於 23 個模型及四種控制範式進行測試。
  • 主要發現:現有系統將觀測世界視為「跟蹤鏡頭」,目標離開畫面後便停止演算,目標回歸時僅恢復遺棄時的狀態,無法延續事件進展。
  • 實驗顯示,此缺陷普遍存在於不同模型家族與規模級別中,單靠提升影像真實度、控制力或引數量無法解決,需從設計上將物理狀態核心的穩定性列為首要目標。
World ModelsWRBenchAGIBenchmarkSimulationHuggingFace

來源 · 1 篇報導

首發 Hugging Face Daily Papers huggingface.co 04:00