Retrieval 化繁為簡:讓 Vision-Language-Action 模型在測試時擴充套件至新任務
為何重要
透過「先取樣後調整引數」的策略,開發者無需為每個新任務進行昂貴的微調,大幅提升了機器人策略部署的彈性與效率。
本研究提出利用「取樣」來取代傳統的「重新訓練」,解決 Vision-Language-Action 模型適配新任務所需的昂貴資料與算力成本。該方法允許系統僅透過加入展示資料並建立索引,讓凍結的模型即可執行新任務,而非更新模型引數。實驗顯示,這種技術優化了 Cosmos Policy 和 RoboTwin 2.0 等構架在未見任務上的表現。