ProCUA-SFT Technical Report
為何重要
這項成果證實了透過嚴格的預先檢查與合成資料集,能有效克服複雜桌面環境中代理訓練的資料瓶頸。
針對電腦用量代理訓練的需求,研究發布了全新的 ProCUA-SFT 資料集,解決了現有 AgentNet 資料集在 UI-TARS 7B 上導致負面轉移的問題。該資料集由 93K 個合成軌跡生成 3.1M 個步驟級 SFT 樣本,利用 Kimi-K2.5 VLM 自動執行並驗證任務。配合該資料集微調 UI-TARS 7B 後,其在 OSWorld 的成功率高達 45.0%,較基礎模型提升 18.7 個百分點。