研究:Mistral 等開源模型在過濾俄羅斯誤導訊息方面表現疲弱,頂級模型僅排第 47 名
為何重要
此研究結果提醒開發者在挑選與部署開源模型時,必須額外評估其在內容過濾與錯假訊息對抗上的安全護欄是否健全。
根據愛沙尼亞研究者的分析,Mistral 與其他開源生成式模型在移除假新聞的表現上遜於其他對照模型。其中 Mistral 最強的模型在 60 個測試模型中僅排第 47 名,顯示開源 AI 在辨識俄羅斯錯假訊息的可靠性上仍有顯著落差。
此研究結果提醒開發者在挑選與部署開源模型時,必須額外評估其在內容過濾與錯假訊息對抗上的安全護欄是否健全。
根據愛沙尼亞研究者的分析,Mistral 與其他開源生成式模型在移除假新聞的表現上遜於其他對照模型。其中 Mistral 最強的模型在 60 個測試模型中僅排第 47 名,顯示開源 AI 在辨識俄羅斯錯假訊息的可靠性上仍有顯著落差。