ai.doge.tg 繁體 AI 情報 最新 專案 搜尋 Telegram ↗

跳脫 LoRA:最受歡迎的微調技術真的最佳選擇嗎?

工具 1 個來源 · 3 小時前
為何重要

- 開發者長期依循 LoRA 這種「隱形慣例」,忽略了可能存在更優的記憶體或效能權衡方案,此研究提供了打破框架的必要性。 - Hugging Face 的基準測試試圖解決學術界論文自訂比較標準與不易複現的問題,提供具體、可重現的實務參考工具。 - 這顯示出主流技術可能因為生態系慣性而產生自我強化迴圈,AI 工具供應商應重視基準測試的公正性與工具的可訪問性。

  • 由於直接微調大型語言模型記憶體消耗極高,業界廣泛使用引數高效微調(PEFT)技術,其中 LoRA 是最受青睞的方法。
  • 統計顯示,在 Hugging Face Hub 上提及單一 PEFT 技術的 20,834 張模型卡中,有 98.4% 標記為 LoRA;GitHub 上搜尋 PEFT 相關程式碼的結果中,亦有 71.3% 指向 LoRA。
  • Hugging Face 官方執行了受控基準測試,在數學推理與影像概念學習等場景中測試多種方法,發現實際效能可能超越 LoRA,挑戰其絕對主流地位。
LoRAPEFTHugging Face基準測試微調

來源 · 1 篇報導

首發 Hugging Face Blog huggingface.co 08:00