ENPIRE:真實世界中代理機器人政策自我提升框架
為何重要
這項突破將機器人開發正式納入自動化最佳化程式,縮減了人為幹預需求。對產業而言,它驗證了 Agent 生態系介入實體控制的可能性,為通用的「物理智慧」開發流程提供了可量化、可擴充套件的潛在路徑;開發者可關注其中開放的最佳化配方與基礎設施建構。
實體機器人靈巧操作長期受制於人工監督與演算法工程瓶頸,ENPIRE 匯入閉環系統,讓編碼代理能在物理世界自動執行政策訓練與演進。article<br>- 框架包含四個核心模組:Environment (EN)、Policy Improvement (PI)、Rollout (R) 與 Evolution (E),運作了場景重置、執行驗證與程式碼迭代的完整迴圈。<br>- 使用前沿編碼代理,能將任務成功率提升至 99%,例如整理收納盒、綁紮帶與工具使用。<br>- 當代理團隊在機器人車隊上並行執行時,訓練學習速度會顯著加快。