專家指出 Anthropic Fable 5 遭禁非因惡意攻擊,僅因其回應「Fix this code」
為何重要
此事件顯示政府將防禦性漏洞修補工具誤認為軍武產物可能削弱美國在 AI 時代的網安防禦能力,導致在面對日益狡詐的進攻者時處於劣勢。
針對美國政府以國安理由對 Anthropic 的 Fable 5 和 Mythos 5 導致出口管制的動作,Katie Moussouris 指出其元兇僅是模型回應「Fix this code」後展現的修補漏洞能力,而非所謂的越獄行為。她解釋,研究團隊的測試僅在驗證模型對防禦性程式碼的可行性,質疑此舉實際上阻礙了防禦者使用先進模型來抵禦攻擊。