HumanScale:單眼人類視訊在具身預訓練中優於真機遙運算元據
為何重要
這項研究為解決具身模型的資料瓶頸提供了一個低成本且可行的路徑,將資料獲取的焦點從昂貴的硬體佈署轉向大規模的影片擷取。這可能讓更多新創團隊專注於演算法最佳化而非資料管道建立,然而卻可能抑製下游機械手臂等硬體資料採集業務的市場需求。
具身 AI 產業長期受限於高成本的遙操作機器人資料難以擴充,新研究測試了替代方案——經過篩選標註的「單眼人類視訊」,發現其作為預訓練資料的效能甚至優於真機資料。
- 在相同預訓練資料量下,模型的驗證損失降低 24%。
- 分佈內 Real-robot 任務執行成功率提升 52.5%。
- 分佈外 Real-robot 任務執行成功率提升 90%。