ai.doge.tg 繁體 AI 情報 最新 專案 搜尋 Telegram ↗

信任對的老師:GUI Grounding 的品質感知自我蒸餾

研究 1 個來源 · 1 小時前
為何重要

此技術優化了 VLMs 在後訓練階段的 token-level 自我監督機制,有助於提升圖形使用者介面自動化測試與代理系統的操作精準度。

該研究針對 On-policy self-distillation (OPSD) 在 GUI grounding 任務中老師訊號不可靠的問題,提出「品質感知自我蒸餾」解決方案。研究人員整合軟體正確性感知閘道與老師機率縮放,過濾因字首偏差而導致的錯誤座標-token 訊號,並校準剩餘訊號強度。實驗於六個 GUI grounding benchmarks 上證實,此方法能有效提升 VLMs 的定位準確度並優於強基準。

GUI GroundingSelf-DistillationVLMComputer VisionOptimization

來源 · 1 篇報導

首發 Hugging Face Daily Papers huggingface.co 04:00