TechFoco Logo
首页专题归档站点地图
© 2026 TechFoco. All rights reserved.
文章归档专题网站地图站点地图 XML爬虫规则GitHub
  1. 首页
  2. /
  3. 返回归档
  4. /
  5. 三个Markdown文件如何解决AI Agent的上下文漂移难题

三个Markdown文件如何解决AI Agent的上下文漂移难题

2026年01月05日•TechFoco 精选

本文探讨了AI Agent在复杂任务中面临的上下文漂移问题,并分析了Manus等方案通过三个核心Markdown文件管理注意力、追踪进度的机制。文章进一步讨论了社区提出的进阶工作流设计,以及上下文工程作为新兴学科的...

Article Image
Article Image

近期,Meta 以 20 亿美元收购了 AI Agent 公司 Manus,引发了业界对其核心技术的关注。一位开发者在社区中分享了其对 Manus 工作流的逆向工程成果,揭示了其应对 AI Agent 普遍困境——上下文漂移——的核心模式。随着任务执行和工具调用的增多,AI Agent 的上下文窗口会不断膨胀,导致早期目标被淹没,任务逐渐偏离轨道。Manus 的解决方案出奇地简洁,其核心仅依赖于三个 Markdown 文件。

核心内容

Manus 工作流的核心是三个 Markdown 文件:task_plan.md 用于通过复选框追踪任务进度;notes.md 用于存储研究过程中的中间内容,避免其塞满主要上下文;deliverable.md 则用于存放最终交付物。其关键机制在于,Agent 在每次进行重大决策前,都会重新读取 task_plan.md 文件。这一操作并非为了减少 token 消耗,而是为了进行“注意力操控”。大型语言模型存在“大海捞针”问题,即随着上下文增长,模型会逐渐遗忘早期设定的目标。通过强制重读计划文件,核心目标被重新拉回模型的注意力窗口中心。

这一模式的有效性得到了独立验证。例如,Claude Code 会自动创建 plan.md 文件,GitHub 的 Spec-kit、多 Agent 管理框架 APM 等开源工具也实现了类似的工作流。多个独立方案的收敛,恰恰证明了该模式解决了真实存在的工程问题。

针对“写入 notes.md 同样消耗 token”的质疑,社区讨论指出,关键在于区分“存储”与“注意力焦点”。写入操作会产生 token,但将非核心信息移出主上下文,能有效保持主上下文的清洁和目标的突出。社区还提出了更进阶的架构方案:使用子 Agent 来处理上下文密集型的繁重任务。主 Agent 保持轻量,专注于进度追踪和协调;子 Agent 在独立上下文中完成任务后,将结果摘要汇报给主 Agent。这样既能处理复杂任务,又能维持主上下文的稳定性。

在实践层面,有开发者分享了将 Claude 视为员工的管理经验:一次只分配一个明确任务,每完成一步就进行提交和人工审核,强调可控的、分步的工作节奏,而非追求“设置后就忘”的全自动化。工作流设计的最佳实践包括:保持核心指令文件极度精简;将数据库、API 文档等专项知识拆分到独立文件,按需加载;维护“愿望清单”文件来记录未来需求,避免干扰当前任务流。

价值与影响

需要明确的是,20 亿美元收购的价值远不止于三个 Markdown 文件。其核心在于 Manus 公司展现的快速商业化能力、虚拟机技术、浏览器自动化及其完整的 Agent 平台。本文讨论的文件管理模式,只是其庞大技术体系中的一块关键拼图。

这场讨论揭示了一个更深层的行业趋势:上下文工程正在演变为一门独立的学科。它要求开发者不仅具备软件工程能力,还需综合理解云服务、API 集成以及 AI Agent 的行为特性,这催生了“Agent 工程师”这一新兴角色。

社区总结的最实用建议是:将 AI 视为需要管理的员工,为其分配任务、检查每个环节、控制每个步骤。试图让 AI 一次性地、无人干预地完成所有复杂任务,在当前技术阶段仍不现实。有效的 AI Agent 应用,依赖于精心的上下文设计、清晰的任务拆解和必要的人工监督。


来源:黑洞资源笔记

相关标签

AI Agent上下文工程工作流设计注意力机制Markdown

继续阅读

较新文章

Node.js 之父 Ryan Dahl:人类写代码的时代结束

较早文章

Anthropic官方Claude Code实战课程要点解析

相关文章

查看更多
Hermes Agent:开源 AI Agent 框架的设计与实现

Hermes Agent:开源 AI Agent 框架的设计与实现

本文介绍了 Nous Research 发布的 Hermes Agent 开源框架,重点阐述其内建的自改进学习循环、三层记忆系统及 Skill 进化机制,并说明其作为《Harness Engineering》理论首...

2026年04月09日
AI Agent开源框架
当 AI Agent 拥有“克隆”大脑:超越容器的沙盒革命

当 AI Agent 拥有“克隆”大脑:超越容器的沙盒革命

本文介绍了一种基于内存写时复制和 MicroVM 的新型虚拟机技术,可实现亚秒级环境克隆,为 AI Agent 的并行决策提供了物理基础,并探讨了其技术优势与潜在挑战。

2026年04月08日
AI Agent虚拟机
Hindsight™:革命性的 AI Agent 记忆系统

Hindsight™:革命性的 AI Agent 记忆系统

Hindsight™ 是一个 AI Agent 记忆系统,旨在解决传统 RAG 或知识图谱在记忆准确率和长期遗忘上的不足,通过自动提取、多路检索和深度反思,让 AI 真正“学会”。

2026年04月08日
AI Agent记忆系统
paper2code:将 ArXiv 论文转化为可运行代码

paper2code:将 ArXiv 论文转化为可运行代码

paper2code 是一款 AI Agent 插件,旨在解决论文复现中因细节模糊导致的效率低下问题。它通过引用锚定和模糊性审计,将论文转化为可追溯、结构完整的代码项目,并明确标注未指定内容。

2026年04月07日
论文复现代码生成
wecom-cli:终端操控企业微信的 AI Agent 工具

wecom-cli:终端操控企业微信的 AI Agent 工具

wecom-cli 是一款通过命令行和 AI Agent 高效操控企业微信的工具,覆盖通讯录、消息、会议等 7 大核心业务,支持 npm 一键安装与快速配置,适合用于自动化办公场景。

2026年04月02日
命令行工具企业微信

DeepSeek 押注 Agent:从“会聊天”到“会干活”

本文基于公开招聘信息,分析了 DeepSeek 公司近期将战略重心转向 AI 智能体(Agent)的动向。文章探讨了 Agent 的核心概念、行业竞争焦点的转移,以及构建可用 Agent 系统所依赖的评测、基础设施...

2026年04月02日
AI AgentDeepSeek