自我演進視覺提問框架

研究 1 個來源 · 1 小時前

為何重要

這解決了高品質訓練資料昂貴的痛點，並開啟了讓模型主動探索、自我精進資料品質的新週期。

本研究提出一套自我演進框架，讓 Vision-Language Model (VLM) 自身充當提問者與篩選器，以生成更具難度與資訊量的視覺特定問題來反向訓練。實驗證實，在相同預算下，此自我監督方法優於使用靜態資料，顯著擴充套件了原本能力邊界。

VLMsSelf-evolvingVisual Question answeringData efficiency

相關動態 · 研究