自我演進視覺提問框架
為何重要
這解決了高品質訓練資料昂貴的痛點,並開啟了讓模型主動探索、自我精進資料品質的新週期。
本研究提出一套自我演進框架,讓 Vision-Language Model (VLM) 自身充當提問者與篩選器,以生成更具難度與資訊量的視覺特定問題來反向訓練。實驗證實,在相同預算下,此自我監督方法優於使用靜態資料,顯著擴充套件了原本能力邊界。
這解決了高品質訓練資料昂貴的痛點,並開啟了讓模型主動探索、自我精進資料品質的新週期。
本研究提出一套自我演進框架,讓 Vision-Language Model (VLM) 自身充當提問者與篩選器,以生成更具難度與資訊量的視覺特定問題來反向訓練。實驗證實,在相同預算下,此自我監督方法優於使用靜態資料,顯著擴充套件了原本能力邊界。