智源研究院王仲遠:世界模型是未來,將成為機器人的真正大腦
為何重要
定義了世界模型的技術標準(如預測「下一物理狀態」),將決定具身智慧能否從狹窄場景走向通用物理世界的發展路徑。
智源研究院院長王仲遠指出,世界模型正朝語言、畫素、3D結構與視覺表徵四條路徑發展,並主張結合語言與視覺的「潛空間」路線。他強調真正的世界模型不僅是生成逼真影像,更要具備物理因果推論、長時序一致性與跨場域泛化能力,將取代 VLA 成為具身智慧的真正基座模型。
定義了世界模型的技術標準(如預測「下一物理狀態」),將決定具身智慧能否從狹窄場景走向通用物理世界的發展路徑。
智源研究院院長王仲遠指出,世界模型正朝語言、畫素、3D結構與視覺表徵四條路徑發展,並主張結合語言與視覺的「潛空間」路線。他強調真正的世界模型不僅是生成逼真影像,更要具備物理因果推論、長時序一致性與跨場域泛化能力,將取代 VLA 成為具身智慧的真正基座模型。