研究：Mistral 等開源模型在過濾俄羅斯誤導訊息方面表現疲弱，頂級模型僅排第 47 名

研究 1 個來源 · 1 天前

為何重要

此研究結果提醒開發者在挑選與部署開源模型時，必須額外評估其在內容過濾與錯假訊息對抗上的安全護欄是否健全。

根據愛沙尼亞研究者的分析，Mistral 與其他開源生成式模型在移除假新聞的表現上遜於其他對照模型。其中 Mistral 最強的模型在 60 個測試模型中僅排第 47 名，顯示開源 AI 在辨識俄羅斯錯假訊息的可靠性上仍有顯著落差。

Mistralopen-source AIRussian disinformationcontent filtering

相關動態 · 研究