ActiveMimic:擁有主動感知的驅動視角影片預訓練
為何重要
確立了主動感知是運用人類視角影片評估機器人預訓練成效的關鍵,有效解決機器人訓練資料集規模不足的痛點。
現有基於人類視角影片的預訓練模型因遺漏「主動感知」訊號,表現往往較遜於機器人資料模型。新模型 ActiveMimic 強調將攝影機運動視為「視角動作」,透過單一佩戴式 RGB 攝影機恢復同步的相機與手部軌跡。實驗顯示,該框架能解鎖人類視角影片的潛在訓練價值,在多樣化任務中超越基線並匹敵機器人資料的 SOTA 水準。
確立了主動感知是運用人類視角影片評估機器人預訓練成效的關鍵,有效解決機器人訓練資料集規模不足的痛點。
現有基於人類視角影片的預訓練模型因遺漏「主動感知」訊號,表現往往較遜於機器人資料模型。新模型 ActiveMimic 強調將攝影機運動視為「視角動作」,透過單一佩戴式 RGB 攝影機恢復同步的相機與手部軌跡。實驗顯示,該框架能解鎖人類視角影片的潛在訓練價值,在多樣化任務中超越基線並匹敵機器人資料的 SOTA 水準。