ENPIRE：真實世界中代理機器人政策自我提升框架

研究 1 個來源 · 2 小時前

為何重要

這項突破將機器人開發正式納入自動化最佳化程式，縮減了人為幹預需求。對產業而言，它驗證了 Agent 生態系介入實體控制的可能性，為通用的「物理智慧」開發流程提供了可量化、可擴充套件的潛在路徑；開發者可關注其中開放的最佳化配方與基礎設施建構。

實體機器人靈巧操作長期受制於人工監督與演算法工程瓶頸，ENPIRE 匯入閉環系統，讓編碼代理能在物理世界自動執行政策訓練與演進。article<br>- 框架包含四個核心模組：Environment (EN)、Policy Improvement (PI)、Rollout (R) 與 Evolution (E)，運作了場景重置、執行驗證與程式碼迭代的完整迴圈。<br>- 使用前沿編碼代理，能將任務成功率提升至 99%，例如整理收納盒、綁紮帶與工具使用。<br>- 當代理團隊在機器人車隊上並行執行時，訓練學習速度會顯著加快。

ENPIREAgentRoboticsSelf-ImprovementSimulation to Real Transfer

來源 · 1 篇報導

首發 Hugging Face Daily Papers huggingface.co 04:00

ENPIRE：真實世界中代理機器人政策自我提升框架

來源 · 1 篇報導

相關動態 · 研究