OPD-Evolver:透過同策略自我擬態培育全像式智慧體進化器
為何重要
此突破推動了自主智慧體從單純儲存或檢索資訊的記憶增強模式,向前邁向真正具備核心進化策略與管理能力的「智慧體進化器」。
研究團隊推出 OPD-Evolver 框架,解決現有記憶智慧體缺乏自我進化能力的問題,教導其如何挑選、使用並維護高價值經驗。該系統採用「快速-慢速」雙迴圈設計,透過成果校準的記憶歸因與擁有優勢資訊的擬態學習來強化智慧體。在多項基準測試中,OPD-Evolver-9B 超越 MemoryBank 等記憶系統達 11.5%,並具備挑戰 Qwen3.5-397B-A17B 等大型模型的實力。