RepSelect：透過表示選擇性實現堅固的 LLM 忘卻技術

研究 1 個來源 · 2 小時前

為何重要

RepSelect 為 LLM 帶來無法輕易被微調或提示恢復的深度安全「忘卻」機制，是推動模型具備監管合規與可信度的重要技術進展。

面對現有 LLM 方法容易復原現況，研究提出 RepSelect，藉由在每次更新前壓低梯度的前幾個主成分，來隔離忘卻集合特定的表示。實驗顯示，該方法在 Llama 3, Qwen 3.5, Gemma 4 E4B, DeepSeek V2 Lite 四個模型家族上，相比最佳基準大幅減少復原準確率（4-50 倍），並對少樣本提示攻擊展現近乎完美魯棒性，同時維持模型的一般能力。

RepSelectLLM Unlearning表示選擇性Llama 3DeepSeek V2 LiteGemma 4 E4B

來源 · 1 篇報導

首發 Hugging Face Daily Papers huggingface.co 04:00

RepSelect：透過表示選擇性實現堅固的 LLM 忘卻技術

來源 · 1 篇報導

相關動態 · 研究