TechFoco Logo
首页专题归档站点地图
© 2026 TechFoco. All rights reserved.
文章归档专题网站地图站点地图 XML爬虫规则GitHub
  1. 首页
  2. /
  3. 返回专题
  4. /
  5. AI记忆系统突破99%准确率:用Agent完全替代向量数据库

AI记忆系统突破99%准确率:用Agent完全替代向量数据库

2026年03月26日•TechFoco 精选

Supermemory团队提出ASMR系统,用多智能体协作替代向量检索,在LongMemEval基准测试上达到99%准确率。该系统通过理解而非相似度匹配来处理记忆任务,架构不依赖外部向量数据库。

Article Image
Article Image

在构建能够长期记忆和回忆信息的 AI 系统时,检索增强生成(RAG)结合向量数据库是当前的主流范式。其核心是通过计算文本嵌入的数学相似度来检索相关信息。然而,这种方法在处理包含事实更新、矛盾和时间序列的复杂对话历史时,往往难以区分“旧事实”与“新更正”,导致检索结果噪声过多,影响最终回答的准确性。

核心内容

近期,Supermemory 团队提出了一种名为 ASMR(Agentic Search and Memory Retrieval)的新方法,并在长期记忆基准测试 LongMemEval(包含 11.5 万 token 的对话历史)上取得了 99% 的准确率。该系统的核心在于完全摒弃了传统的向量检索,转而采用多智能体(Agent)协作机制,让 AI 通过“理解”而非“数学相似度”来回忆信息。

ASMR 系统的工作流程分为三个阶段:

  1. 信息摄取:3 个并行的 Observer Agent 同时读取对话记录,按照个人信息、偏好、事件、时间数据等六个维度提取知识点,并直接存储为结构化内容,而非生成向量嵌入(embedding)。
  2. 检索阶段:面对用户提问时,系统不查询向量数据库,而是派出 3 个专门的搜索 Agent 并行工作:一个负责查找直接事实,一个负责挖掘隐含语境,另一个负责重建事件时间线。这些 Agent 的本质是在进行主动的阅读和推理,而非计算余弦相似度。
  3. 回答阶段:团队测试了两种策略。第一种是让 8 个高度专业化的 prompt 变体(如精确计数专家、时间专家等)并行运行,任何一条推理路径答对即算成功,准确率达到 98.6%。第二种是让 12 个 Agent 独立作答,再由一个聚合器大语言模型(LLM)综合投票裁决,准确率为 97.2%。

价值与影响

这项工作的价值在于,它通过实验表明,基于“认知理解”的 Agent 方法在处理记忆任务时,可能比基于“数学相似性”的传统 RAG 方法更具优势。数学相似度只能捕捉表层模式,而智能体能够更好地处理时间序列中的矛盾、信息更新和细微差别。

此外,ASMR 架构完全在内存中运行,不依赖任何外部向量数据库,这使其理论上能够部署到包括机器人在内的任何设备上,提升了系统的可移植性和应用潜力。团队已宣布将在不久后开源全部代码。

这项突破促使业界重新思考 AI 记忆系统的设计方向。当未来需要处理数十亿个性化 AI Agent 的海量记忆时,系统的瓶颈可能不在于算力,而在于我们赋予 Agent 多少“主动思考”的权限。ASMR 为探索这一方向提供了一个切实可行的技术路径。


来源:黑洞资源笔记

相关标签

Agentic AIRAGMemory RetrievalAI AgentLongMemEval

继续阅读

较新文章

Honcho:开源记忆库与托管服务

较早文章

OpenEnv:强化学习环境的容器化部署与接口库

相关文章

查看更多
wecom-cli:终端操控企业微信的 AI Agent 工具

wecom-cli:终端操控企业微信的 AI Agent 工具

wecom-cli 是一款通过命令行和 AI Agent 高效操控企业微信的工具,覆盖通讯录、消息、会议等 7 大核心业务,支持 npm 一键安装与快速配置,适合用于自动化办公场景。

2026年04月02日
命令行工具企业微信

DeepSeek 押注 Agent:从“会聊天”到“会干活”

本文基于公开招聘信息,分析了 DeepSeek 公司近期将战略重心转向 AI 智能体(Agent)的动向。文章探讨了 Agent 的核心概念、行业竞争焦点的转移,以及构建可用 Agent 系统所依赖的评测、基础设施...

2026年04月02日
AI AgentDeepSeek
AI Agent 开发的极简主义:25个项目后的核心教训

AI Agent 开发的极简主义:25个项目后的核心教训

一位开发者在构建超过25个AI Agent项目后发现,真正稳定盈利的往往是结构极简的系统,复杂的多Agent设计常导致可靠性下降和成本增加。

2026年03月29日
AI Agent系统设计
Honcho:开源记忆库与托管服务

Honcho:开源记忆库与托管服务

Honcho 是一款专为构建有状态 AI 智能体设计的开源记忆库与托管服务。它通过统一的伙伴模型、多种记忆存储原语和异步推理系统,帮助智能体维护动态状态,实现更自然、个性化的交互。

2026年03月26日
AI AgentMemory Management
AI记忆系统突破99%准确率:用Agent完全替代向量数据库

AI记忆系统突破99%准确率:用Agent完全替代向量数据库

Supermemory团队提出ASMR系统,用多智能体协作替代向量检索,在LongMemEval基准测试上达到99%准确率。该系统通过理解而非相似度匹配来处理记忆任务,架构不依赖外部向量数据库。

2026年03月26日
Agentic AIRAG
LightRAG:整合知识图谱与多模态检索的 RAG 框架

LightRAG:整合知识图谱与多模态检索的 RAG 框架

LightRAG 是一个检索增强生成框架,旨在高效整合大语言模型与知识图谱,支持多模态文档处理、多种存储后端及模型接口,并提供丰富的工具链与监控功能。

2026年03月26日
RAG FrameworkKnowledge Graph