LedgerAgent：具備結構化狀態的政策遵守工具呼叫代理

研究 1 個來源 · 1 小時前

為何重要

這項研究揭示瞭解決大型語言模型（LLM）在應用場景中「狀態孤島」與「政策邏輯切斷」關鍵架構。對開發者而言，將狀態與指令分離能大幅降低 AI Agent 在複雜任務中產生幻覺與違反規則的機率；從產業觀點來看，這是通往具備深度記憶與強邏輯約束的通用 AI Agent 必經的工程化路徑。

LedgerAgent 是一種推論時方法，旨在讓工具呼叫代理在獨立的結構化「日記帳」中維護任務狀態，解決標準代理在提示詞中管理狀態不一致的問題。
與將狀態隱含在提示詞中的標準代理不同，該方法透過獨立記錄資訊，並在執行可能改變環境的工具呼叫前進行政策約束檢查，防止違規。
在四個客戶服務領域及開放與封閉權重模型的混合測試組合上，LedgerAgent 相較於標準提示式工具呼叫方法提升了平均 pass@k 效能，且在更嚴格的多嘗試一致性度量下展現最大優勢。

LedgerAgentLLM AgentsTool-CallingPolicy AdherenceState ManagementHugging Face

相關動態 · 研究