DreamX-World 1.0:通用型互動世界模型
為何重要
DreamX-World 1.0 在長期影片生成與攝影機控制的評分上取得領先優勢,展示了在少步驟自回歸世界模型應用中,結合因果強制與記憶條件技術的強大效能。
DreamX-World 1.0 是一款通用型互動模型,能將文字或圖片轉換為可控的長期影片生成,支援攝影機導航與重新訪問已觀察區域。研究團隊透過 E-PRoPE 與記憶條件永續性技術,強化了模型的場景保留與攝影機控制能力。該模型在 8 臺 RTX 5090 GPU 上可達到每秒 16 幀,且在評分基準上超越了 HY-WorldPlay 1.5 與 LingBot-World。