ai.doge.tg 繁體 AI 情報 最新 專案 搜尋 Telegram ↗

在 Elasticsearch 上建置具備 0.89 recall 的持久化 Agent 記憶層

工具 1 個來源 · 1 小時前
為何重要

此架構證明瞭「搜尋引擎作為 Agent 記憶底層」的實用性,解決了單純依賴擴充 Context Window 在成本、效能與「遺忘中間資訊」上的瓶頸。這對於 B2B Agent(尤其是需要長期互動如智慧家居或企業顧問)的規模化生產程序具有深遠影響,展現了高效檢索管道在 AI 應用中的戰略意義。

為瞭解決 LLM Agent 在跨會議與長期情境中的記憶遺漏問題,開發團隊採用 Elasticsearch 實作持久化記憶層,將記憶結構劃分為三類索引並搭配混合檢索技術。

  • 建構包含情境、知識與程式三種索引的記憶系統,結合 RRF、BM25 與 Jina v5 向量搜尋及 Jina v2 cross-encoder 重排序器。
  • 在 168 剋 QA 風格評估中達到 0.89 的 R@10 召回率,並透過 DLS 隔離機制確保零租戶洩漏。
  • 提供完整開源實作,並主要針對長期保留使用者狀態(如設定歷史)的 Agent 應用。
ElasticsearchAgent memoryHybrid searchLLM contextRAG

來源 · 1 篇報導

首發 Hacker News Front Page elastic.co 19:20