TechFoco Logo
首页专题归档站点地图
© 2026 TechFoco. All rights reserved.
文章归档专题网站地图站点地图 XML爬虫规则GitHub
  1. 首页
  2. /
  3. 返回专题
  4. /
  5. AI记忆系统突破99%准确率:用Agent完全替代向量数据库

AI记忆系统突破99%准确率:用Agent完全替代向量数据库

2026年03月26日•TechFoco 精选

Supermemory团队提出ASMR系统,用多智能体协作替代向量检索,在LongMemEval基准测试上达到99%准确率。该系统通过理解而非相似度匹配来处理记忆任务,架构不依赖外部向量数据库。

Article Image
Article Image

在构建能够长期记忆和回忆信息的 AI 系统时,检索增强生成(RAG)结合向量数据库是当前的主流范式。其核心是通过计算文本嵌入的数学相似度来检索相关信息。然而,这种方法在处理包含事实更新、矛盾和时间序列的复杂对话历史时,往往难以区分“旧事实”与“新更正”,导致检索结果噪声过多,影响最终回答的准确性。

核心内容

近期,Supermemory 团队提出了一种名为 ASMR(Agentic Search and Memory Retrieval)的新方法,并在长期记忆基准测试 LongMemEval(包含 11.5 万 token 的对话历史)上取得了 99% 的准确率。该系统的核心在于完全摒弃了传统的向量检索,转而采用多智能体(Agent)协作机制,让 AI 通过“理解”而非“数学相似度”来回忆信息。

ASMR 系统的工作流程分为三个阶段:

  1. 信息摄取:3 个并行的 Observer Agent 同时读取对话记录,按照个人信息、偏好、事件、时间数据等六个维度提取知识点,并直接存储为结构化内容,而非生成向量嵌入(embedding)。
  2. 检索阶段:面对用户提问时,系统不查询向量数据库,而是派出 3 个专门的搜索 Agent 并行工作:一个负责查找直接事实,一个负责挖掘隐含语境,另一个负责重建事件时间线。这些 Agent 的本质是在进行主动的阅读和推理,而非计算余弦相似度。
  3. 回答阶段:团队测试了两种策略。第一种是让 8 个高度专业化的 prompt 变体(如精确计数专家、时间专家等)并行运行,任何一条推理路径答对即算成功,准确率达到 98.6%。第二种是让 12 个 Agent 独立作答,再由一个聚合器大语言模型(LLM)综合投票裁决,准确率为 97.2%。

价值与影响

这项工作的价值在于,它通过实验表明,基于“认知理解”的 Agent 方法在处理记忆任务时,可能比基于“数学相似性”的传统 RAG 方法更具优势。数学相似度只能捕捉表层模式,而智能体能够更好地处理时间序列中的矛盾、信息更新和细微差别。

此外,ASMR 架构完全在内存中运行,不依赖任何外部向量数据库,这使其理论上能够部署到包括机器人在内的任何设备上,提升了系统的可移植性和应用潜力。团队已宣布将在不久后开源全部代码。

这项突破促使业界重新思考 AI 记忆系统的设计方向。当未来需要处理数十亿个性化 AI Agent 的海量记忆时,系统的瓶颈可能不在于算力,而在于我们赋予 Agent 多少“主动思考”的权限。ASMR 为探索这一方向提供了一个切实可行的技术路径。


来源:黑洞资源笔记

相关标签

Agentic AIRAGMemory RetrievalAI AgentLongMemEval

继续阅读

较新文章

Honcho:开源记忆库与托管服务

较早文章

OpenEnv:强化学习环境的容器化部署与接口库

相关文章

查看更多

有道宝库:AI研究助手的技术架构解析

有道宝库是一款基于RAG架构的AI研究助手,通过强制溯源、多文档融合与中文专项优化,旨在辅助深度思考与知识内化。

2026年04月16日
RAG多文档融合
Hermes Agent:开源 AI Agent 框架的设计与实现

Hermes Agent:开源 AI Agent 框架的设计与实现

本文介绍了 Nous Research 发布的 Hermes Agent 开源框架,重点阐述其内建的自改进学习循环、三层记忆系统及 Skill 进化机制,并说明其作为《Harness Engineering》理论首...

2026年04月09日
AI Agent开源框架
当 AI Agent 拥有“克隆”大脑:超越容器的沙盒革命

当 AI Agent 拥有“克隆”大脑:超越容器的沙盒革命

本文介绍了一种基于内存写时复制和 MicroVM 的新型虚拟机技术,可实现亚秒级环境克隆,为 AI Agent 的并行决策提供了物理基础,并探讨了其技术优势与潜在挑战。

2026年04月08日
AI Agent虚拟机
Hindsight™:革命性的 AI Agent 记忆系统

Hindsight™:革命性的 AI Agent 记忆系统

Hindsight™ 是一个 AI Agent 记忆系统,旨在解决传统 RAG 或知识图谱在记忆准确率和长期遗忘上的不足,通过自动提取、多路检索和深度反思,让 AI 真正“学会”。

2026年04月08日
AI Agent记忆系统
paper2code:将 ArXiv 论文转化为可运行代码

paper2code:将 ArXiv 论文转化为可运行代码

paper2code 是一款 AI Agent 插件,旨在解决论文复现中因细节模糊导致的效率低下问题。它通过引用锚定和模糊性审计,将论文转化为可追溯、结构完整的代码项目,并明确标注未指定内容。

2026年04月07日
论文复现代码生成
wecom-cli:终端操控企业微信的 AI Agent 工具

wecom-cli:终端操控企业微信的 AI Agent 工具

wecom-cli 是一款通过命令行和 AI Agent 高效操控企业微信的工具,覆盖通讯录、消息、会议等 7 大核心业务,支持 npm 一键安装与快速配置,适合用于自动化办公场景。

2026年04月02日
命令行工具企业微信