物理智商驗證:改進影片生成模型的評測基準
為何重要
更可靠的物理評測標準將有助於驅動生成式模型具備更逼真的現實模擬能力,加速 AI 在視覺領域的技術突破。
為了推進世界模擬和影片生成等下游任務,Google DeepMind 團隊推出了 Physics-IQ 基準,旨在評估影片生成模型(VGMs)對現實物理世界的理解能力。最新的 Physics-IQ Verified 版本針對提示詞和培訓資料進行了系統性修正,修正了 57.6% 的樣本並提升了其評分一致性。在對六個影像轉影片生成模型的比較研究中,發現排名出現了中等程度但有意義的變化。