AI记忆系统突破99%准确率:用Agent完全替代向量数据库
Supermemory团队提出ASMR系统,用多智能体协作替代向量检索,在LongMemEval基准测试上达到99%准确率。该系统通过理解而非相似度匹配来处理记忆任务,架构不依赖外部向量数据库。

在构建能够长期记忆和回忆信息的 AI 系统时,检索增强生成(RAG)结合向量数据库是当前的主流范式。其核心是通过计算文本嵌入的数学相似度来检索相关信息。然而,这种方法在处理包含事实更新、矛盾和时间序列的复杂对话历史时,往往难以区分“旧事实”与“新更正”,导致检索结果噪声过多,影响最终回答的准确性。
核心内容
近期,Supermemory 团队提出了一种名为 ASMR(Agentic Search and Memory Retrieval)的新方法,并在长期记忆基准测试 LongMemEval(包含 11.5 万 token 的对话历史)上取得了 99% 的准确率。该系统的核心在于完全摒弃了传统的向量检索,转而采用多智能体(Agent)协作机制,让 AI 通过“理解”而非“数学相似度”来回忆信息。
ASMR 系统的工作流程分为三个阶段:
- 信息摄取:3 个并行的 Observer Agent 同时读取对话记录,按照个人信息、偏好、事件、时间数据等六个维度提取知识点,并直接存储为结构化内容,而非生成向量嵌入(embedding)。
- 检索阶段:面对用户提问时,系统不查询向量数据库,而是派出 3 个专门的搜索 Agent 并行工作:一个负责查找直接事实,一个负责挖掘隐含语境,另一个负责重建事件时间线。这些 Agent 的本质是在进行主动的阅读和推理,而非计算余弦相似度。
- 回答阶段:团队测试了两种策略。第一种是让 8 个高度专业化的 prompt 变体(如精确计数专家、时间专家等)并行运行,任何一条推理路径答对即算成功,准确率达到 98.6%。第二种是让 12 个 Agent 独立作答,再由一个聚合器大语言模型(LLM)综合投票裁决,准确率为 97.2%。
价值与影响
这项工作的价值在于,它通过实验表明,基于“认知理解”的 Agent 方法在处理记忆任务时,可能比基于“数学相似性”的传统 RAG 方法更具优势。数学相似度只能捕捉表层模式,而智能体能够更好地处理时间序列中的矛盾、信息更新和细微差别。
此外,ASMR 架构完全在内存中运行,不依赖任何外部向量数据库,这使其理论上能够部署到包括机器人在内的任何设备上,提升了系统的可移植性和应用潜力。团队已宣布将在不久后开源全部代码。
这项突破促使业界重新思考 AI 记忆系统的设计方向。当未来需要处理数十亿个性化 AI Agent 的海量记忆时,系统的瓶颈可能不在于算力,而在于我们赋予 Agent 多少“主动思考”的权限。ASMR 为探索这一方向提供了一个切实可行的技术路径。
来源:黑洞资源笔记



