三个Markdown文件如何解决AI Agent的上下文漂移难题

近期，Meta 以 20 亿美元收购了 AI Agent 公司 Manus，引发了业界对其核心技术的关注。一位开发者在社区中分享了其对 Manus 工作流的逆向工程成果，揭示了其应对 AI Agent 普遍困境——上下文漂移——的核心模式。随着任务执行和工具调用的增多，AI Agent 的上下文窗口会不断膨胀，导致早期目标被淹没，任务逐渐偏离轨道。Manus 的解决方案出奇地简洁，其核心仅依赖于三个 Markdown 文件。

核心内容

Manus 工作流的核心是三个 Markdown 文件：task_plan.md 用于通过复选框追踪任务进度；notes.md 用于存储研究过程中的中间内容，避免其塞满主要上下文；deliverable.md 则用于存放最终交付物。其关键机制在于，Agent 在每次进行重大决策前，都会重新读取 task_plan.md 文件。这一操作并非为了减少 token 消耗，而是为了进行“注意力操控”。大型语言模型存在“大海捞针”问题，即随着上下文增长，模型会逐渐遗忘早期设定的目标。通过强制重读计划文件，核心目标被重新拉回模型的注意力窗口中心。

这一模式的有效性得到了独立验证。例如，Claude Code 会自动创建 plan.md 文件，GitHub 的 Spec-kit、多 Agent 管理框架 APM 等开源工具也实现了类似的工作流。多个独立方案的收敛，恰恰证明了该模式解决了真实存在的工程问题。

针对“写入 notes.md 同样消耗 token”的质疑，社区讨论指出，关键在于区分“存储”与“注意力焦点”。写入操作会产生 token，但将非核心信息移出主上下文，能有效保持主上下文的清洁和目标的突出。社区还提出了更进阶的架构方案：使用子 Agent 来处理上下文密集型的繁重任务。主 Agent 保持轻量，专注于进度追踪和协调；子 Agent 在独立上下文中完成任务后，将结果摘要汇报给主 Agent。这样既能处理复杂任务，又能维持主上下文的稳定性。

在实践层面，有开发者分享了将 Claude 视为员工的管理经验：一次只分配一个明确任务，每完成一步就进行提交和人工审核，强调可控的、分步的工作节奏，而非追求“设置后就忘”的全自动化。工作流设计的最佳实践包括：保持核心指令文件极度精简；将数据库、API 文档等专项知识拆分到独立文件，按需加载；维护“愿望清单”文件来记录未来需求，避免干扰当前任务流。

价值与影响

需要明确的是，20 亿美元收购的价值远不止于三个 Markdown 文件。其核心在于 Manus 公司展现的快速商业化能力、虚拟机技术、浏览器自动化及其完整的 Agent 平台。本文讨论的文件管理模式，只是其庞大技术体系中的一块关键拼图。

这场讨论揭示了一个更深层的行业趋势：上下文工程正在演变为一门独立的学科。它要求开发者不仅具备软件工程能力，还需综合理解云服务、API 集成以及 AI Agent 的行为特性，这催生了“Agent 工程师”这一新兴角色。

社区总结的最实用建议是：将 AI 视为需要管理的员工，为其分配任务、检查每个环节、控制每个步骤。试图让 AI 一次性地、无人干预地完成所有复杂任务，在当前技术阶段仍不现实。有效的 AI Agent 应用，依赖于精心的上下文设计、清晰的任务拆解和必要的人工监督。

三个Markdown文件如何解决AI Agent的上下文漂移难题

核心内容

价值与影响

相关标签

继续阅读

AI 复杂任务正从 Markdown 转向 HTML

Algebrica：开源大学数学知识库

AI Agent 并未减负：体力换脑力，倦怠升级

从零构建 AI Agent：新书实战指南

有道宝库：AI研究助手的技术架构解析

GBrain：将 Markdown 知识库转化为智能大脑

核心内容

价值与影响

相关标签

继续阅读

相关文章

AI 复杂任务正从 Markdown 转向 HTML

Algebrica：开源大学数学知识库

AI Agent 并未减负：体力换脑力，倦怠升级

从零构建 AI Agent：新书实战指南

有道宝库：AI研究助手的技术架构解析

GBrain：将 Markdown 知识库转化为智能大脑