Memento:利用重建記憶實現長影片的穩定性
為何重要
透過強化長影片生成的「記憶」機制解決主體模糊問題,大幅提升了 AI 觀看與創作長鏡頭畫面的能力與品質。
長影片生成中的難點在於反覆出現的主體常因時序分解方法而導致形象崩潰;本研究提出 Memento 框架,將主體保留定義為明確的身份連結問題。該方法聯合訓練自回歸生成與記憶重構,透過雙查詢記憶機制區分長遠與短暫的視覺線索,並利用主體感知的電影資料管道提供監督。實測顯示,Memento 在長期主體一致性與視覺品質上均達到 SOTA 效能。