三个Markdown文件如何解决AI Agent的上下文漂移难题
本文探讨了AI Agent在复杂任务中面临的上下文漂移问题,并分析了Manus等方案通过三个核心Markdown文件管理注意力、追踪进度的机制。文章进一步讨论了社区提出的进阶工作流设计,以及上下文工程作为新兴学科的...

近期,Meta 以 20 亿美元收购了 AI Agent 公司 Manus,引发了业界对其核心技术的关注。一位开发者在社区中分享了其对 Manus 工作流的逆向工程成果,揭示了其应对 AI Agent 普遍困境——上下文漂移——的核心模式。随着任务执行和工具调用的增多,AI Agent 的上下文窗口会不断膨胀,导致早期目标被淹没,任务逐渐偏离轨道。Manus 的解决方案出奇地简洁,其核心仅依赖于三个 Markdown 文件。
核心内容
Manus 工作流的核心是三个 Markdown 文件:task_plan.md 用于通过复选框追踪任务进度;notes.md 用于存储研究过程中的中间内容,避免其塞满主要上下文;deliverable.md 则用于存放最终交付物。其关键机制在于,Agent 在每次进行重大决策前,都会重新读取 task_plan.md 文件。这一操作并非为了减少 token 消耗,而是为了进行“注意力操控”。大型语言模型存在“大海捞针”问题,即随着上下文增长,模型会逐渐遗忘早期设定的目标。通过强制重读计划文件,核心目标被重新拉回模型的注意力窗口中心。
这一模式的有效性得到了独立验证。例如,Claude Code 会自动创建 plan.md 文件,GitHub 的 Spec-kit、多 Agent 管理框架 APM 等开源工具也实现了类似的工作流。多个独立方案的收敛,恰恰证明了该模式解决了真实存在的工程问题。
针对“写入 notes.md 同样消耗 token”的质疑,社区讨论指出,关键在于区分“存储”与“注意力焦点”。写入操作会产生 token,但将非核心信息移出主上下文,能有效保持主上下文的清洁和目标的突出。社区还提出了更进阶的架构方案:使用子 Agent 来处理上下文密集型的繁重任务。主 Agent 保持轻量,专注于进度追踪和协调;子 Agent 在独立上下文中完成任务后,将结果摘要汇报给主 Agent。这样既能处理复杂任务,又能维持主上下文的稳定性。
在实践层面,有开发者分享了将 Claude 视为员工的管理经验:一次只分配一个明确任务,每完成一步就进行提交和人工审核,强调可控的、分步的工作节奏,而非追求“设置后就忘”的全自动化。工作流设计的最佳实践包括:保持核心指令文件极度精简;将数据库、API 文档等专项知识拆分到独立文件,按需加载;维护“愿望清单”文件来记录未来需求,避免干扰当前任务流。
价值与影响
需要明确的是,20 亿美元收购的价值远不止于三个 Markdown 文件。其核心在于 Manus 公司展现的快速商业化能力、虚拟机技术、浏览器自动化及其完整的 Agent 平台。本文讨论的文件管理模式,只是其庞大技术体系中的一块关键拼图。
这场讨论揭示了一个更深层的行业趋势:上下文工程正在演变为一门独立的学科。它要求开发者不仅具备软件工程能力,还需综合理解云服务、API 集成以及 AI Agent 的行为特性,这催生了“Agent 工程师”这一新兴角色。
社区总结的最实用建议是:将 AI 视为需要管理的员工,为其分配任务、检查每个环节、控制每个步骤。试图让 AI 一次性地、无人干预地完成所有复杂任务,在当前技术阶段仍不现实。有效的 AI Agent 应用,依赖于精心的上下文设计、清晰的任务拆解和必要的人工监督。
来源:黑洞资源笔记





