ai.doge.tg 繁體 AI 情報 最新 專案 搜尋 Telegram ↗

RepSelect:透過表示選擇性實現堅固的 LLM 忘卻技術

研究 1 個來源 · 2 小時前
為何重要

RepSelect 為 LLM 帶來無法輕易被微調或提示恢復的深度安全「忘卻」機制,是推動模型具備監管合規與可信度的重要技術進展。

面對現有 LLM 方法容易復原現況,研究提出 RepSelect,藉由在每次更新前壓低梯度的前幾個主成分,來隔離忘卻集合特定的表示。實驗顯示,該方法在 Llama 3, Qwen 3.5, Gemma 4 E4B, DeepSeek V2 Lite 四個模型家族上,相比最佳基準大幅減少復原準確率(4-50 倍),並對少樣本提示攻擊展現近乎完美魯棒性,同時維持模型的一般能力。

RepSelectLLM Unlearning表示選擇性Llama 3DeepSeek V2 LiteGemma 4 E4B

來源 · 1 篇報導

首發 Hugging Face Daily Papers huggingface.co 04:00