在 Elasticsearch 上建置具備 0.89 recall 的持久化 Agent 記憶層
為何重要
此架構證明瞭「搜尋引擎作為 Agent 記憶底層」的實用性,解決了單純依賴擴充 Context Window 在成本、效能與「遺忘中間資訊」上的瓶頸。這對於 B2B Agent(尤其是需要長期互動如智慧家居或企業顧問)的規模化生產程序具有深遠影響,展現了高效檢索管道在 AI 應用中的戰略意義。
為瞭解決 LLM Agent 在跨會議與長期情境中的記憶遺漏問題,開發團隊採用 Elasticsearch 實作持久化記憶層,將記憶結構劃分為三類索引並搭配混合檢索技術。
- 建構包含情境、知識與程式三種索引的記憶系統,結合 RRF、BM25 與 Jina v5 向量搜尋及 Jina v2 cross-encoder 重排序器。
- 在 168 剋 QA 風格評估中達到 0.89 的 R@10 召回率,並透過 DLS 隔離機制確保零租戶洩漏。
- 提供完整開源實作,並主要針對長期保留使用者狀態(如設定歷史)的 Agent 應用。