AI记忆系统突破99%准确率：用Agent完全替代向量数据库

在构建能够长期记忆和回忆信息的 AI 系统时，检索增强生成（RAG）结合向量数据库是当前的主流范式。其核心是通过计算文本嵌入的数学相似度来检索相关信息。然而，这种方法在处理包含事实更新、矛盾和时间序列的复杂对话历史时，往往难以区分“旧事实”与“新更正”，导致检索结果噪声过多，影响最终回答的准确性。

核心内容

近期，Supermemory 团队提出了一种名为 ASMR（Agentic Search and Memory Retrieval）的新方法，并在长期记忆基准测试 LongMemEval（包含 11.5 万 token 的对话历史）上取得了 99% 的准确率。该系统的核心在于完全摒弃了传统的向量检索，转而采用多智能体（Agent）协作机制，让 AI 通过“理解”而非“数学相似度”来回忆信息。

ASMR 系统的工作流程分为三个阶段：

信息摄取：3 个并行的 Observer Agent 同时读取对话记录，按照个人信息、偏好、事件、时间数据等六个维度提取知识点，并直接存储为结构化内容，而非生成向量嵌入（embedding）。
检索阶段：面对用户提问时，系统不查询向量数据库，而是派出 3 个专门的搜索 Agent 并行工作：一个负责查找直接事实，一个负责挖掘隐含语境，另一个负责重建事件时间线。这些 Agent 的本质是在进行主动的阅读和推理，而非计算余弦相似度。
回答阶段：团队测试了两种策略。第一种是让 8 个高度专业化的 prompt 变体（如精确计数专家、时间专家等）并行运行，任何一条推理路径答对即算成功，准确率达到 98.6%。第二种是让 12 个 Agent 独立作答，再由一个聚合器大语言模型（LLM）综合投票裁决，准确率为 97.2%。

价值与影响

这项工作的价值在于，它通过实验表明，基于“认知理解”的 Agent 方法在处理记忆任务时，可能比基于“数学相似性”的传统 RAG 方法更具优势。数学相似度只能捕捉表层模式，而智能体能够更好地处理时间序列中的矛盾、信息更新和细微差别。

此外，ASMR 架构完全在内存中运行，不依赖任何外部向量数据库，这使其理论上能够部署到包括机器人在内的任何设备上，提升了系统的可移植性和应用潜力。团队已宣布将在不久后开源全部代码。

这项突破促使业界重新思考 AI 记忆系统的设计方向。当未来需要处理数十亿个性化 AI Agent 的海量记忆时，系统的瓶颈可能不在于算力，而在于我们赋予 Agent 多少“主动思考”的权限。ASMR 为探索这一方向提供了一个切实可行的技术路径。

来源：黑洞资源笔记

AI记忆系统突破99%准确率：用Agent完全替代向量数据库

核心内容

价值与影响

相关标签

继续阅读

wecom-cli：终端操控企业微信的 AI Agent 工具

DeepSeek 押注 Agent：从“会聊天”到“会干活”

AI Agent 开发的极简主义：25个项目后的核心教训

Honcho：开源记忆库与托管服务