AI Agent 上下文工程:3 个 Markdown 文件解决漂移难题
AI Agent通过三个Markdown文件管理上下文:task_plan追踪进度,notes存储研究,deliverable存放结果。核心是决策前重读计划文件,确保目标不偏离。
近日,Meta 以高达 20 亿美元的价格收购了 AI Agent 初创公司 Manus,这一消息在人工智能领域引起了广泛关注。一位细心的开发者在深入研究后,揭示了其核心工作流中一个看似简单却极为有效的模式,并将其开源分享。这一发现的核心,直指当前 AI Agent 发展中的一个普遍困境:上下文漂移。
AI Agent 的普遍困境:迷失在工具调用中
随着 AI Agent 执行复杂任务,它们需要频繁调用各种工具、访问外部数据并进行多轮推理。在这个过程中,一个棘手的问题逐渐浮现:经过大量的工具调用和信息处理后,Agent 往往会逐渐“迷失”最初的目标。上下文窗口不断膨胀,关键的错误信息被淹没在海量中间结果里,最终导致任务偏离预定轨道。这种现象,被称为“上下文漂移”,是制约 Agent 长期、稳定执行任务的主要瓶颈之一。
Manus 的优雅解决方案:三个 Markdown 文件
Manus 被揭示的解决方案出人意料地简洁,其核心仅依赖于三个结构清晰的 Markdown 文件。第一个文件是 task_plan.md,它就像一个动态的项目看板,使用复选框来清晰追踪任务的进度和待办事项。第二个文件是 notes.md,它充当了 Agent 的“外部大脑”,专门用于存储研究过程中的中间发现、数据和灵感,从而避免这些内容挤占宝贵的主上下文空间。第三个文件是 deliverable.md,它定义了任务的最终产出物,为整个工作流程锚定了明确的目标。
这个工作流的核心机制在于其循环读取与状态刷新的设计。AI Agent 并非在启动时一次性读取所有指令后就埋头执行,而是在每次做出重大决策或步骤转换前,都会重新读取 task_plan.md 文件。这一简单的动作,确保了任务的终极目标能够被持续地、强制性地拉回 Agent 的“注意力窗口”之内,有效对抗了因上下文膨胀而导致的目标遗忘。
社区洞见:模式验证与深度探讨
这一发现迅速在开发者社区引发了热烈讨论,并催生了一系列深刻的洞见。首先,面对“这并非全新概念”的质疑,社区给出了肯定的回答。确实,Anthropic 的 Claude Code 本身就会自动创建 plan.md 文件来管理任务,而像 Spec-kit 和 多 Agent 管理框架 APM 这样的开源工具也早已实现了类似的工作流。但这恰恰从侧面验证了该模式的有效性——当来自不同背景的独立开发者不约而同地收敛到同一种解决方案时,这通常意味着它确实击中了某个普遍存在的真实痛点。
其次,针对“向 notes.md 写入内容不也是在消耗上下文 Token 吗”这一技术性质疑,讨论指出了问题的关键所在。写入操作确实会产生 Token 消耗,但核心优化目标并非单纯减少 Token 数量,而是进行精妙的注意力操控。大型语言模型普遍存在“大海捞针”问题,即随着上下文长度增长,模型对早期关键信息的关注度会急剧下降。通过在决策节点重新读取计划文件,相当于周期性地将任务目标“高亮”并置顶,从而巧妙地引导了模型的注意力分配。
进阶方案与最佳实践
基于此基础模式,社区提出了更进阶的架构思路:主从 Agent 协作。在这种设计中,一个轻量级的“主 Agent”负责保持对整体目标和进度的追踪,其上下文始终保持精简;而繁重的、上下文密集型的子任务(如深度研究、代码编写)则被分配给独立的“子 Agent”去完成。子 Agent 在专属的、隔离的上下文中工作,完成任务后将结果摘要汇报给主 Agent。这样既保证了核心决策环路的清晰与稳定,又能高效处理复杂任务。
一位经验丰富的开发者分享了他的实战经验:将 Claude 这样的 AI 模型视为一名员工,而非全知全能的自动化机器。一次只分配一个明确、可验证的小任务,每完成一步就进行提交(例如提交到 Git)并由人工审核。这模仿的是可持续的“8 小时工作制”节奏,而非一劳永逸的“设置后放任不管”的幻想。
关于工作流设计的最佳实践,共识逐渐清晰:保持核心指令文件极度精简,只描述最根本的行为预期;将数据库 Schema、API 文档等专项知识拆分到独立的参考文件中,仅在执行相关任务时动态加载;同时,维护一个“愿望清单”或“未来改进”文件,让那些不属于当前迭代范围的想法有处安放,而不干扰当下的核心工作流。
超越文件:20 亿美元的价值所在
当然,也有评论者一针见血地指出:Meta 斥资 20 亿美元收购的,绝不仅仅是三个 Markdown 文件的创意。这笔交易的核心价值在于 Manus 作为一家公司在短短六个月内创造 1 亿美元收入的卓越能力,以及其背后强大的虚拟机能力、浏览器自动化技术和完整的 Agent 平台。这个三文件工作流模式,只是其精妙工程体系中的一块关键拼图,它揭示了如何系统性地管理 Agent 认知状态。
趋势展望:上下文工程与新兴职业
这场深入的讨论揭示了一个更深层次的行业趋势:上下文工程 正在迅速演变为一门独立的、至关重要的学科。我们正在亲眼见证“Agent 工程师”这一新角色的诞生。他们不仅仅是传统的软件工程师,更需要融合对云服务、API 集成以及 AI Agent 能力边界与特性的综合理解,专注于设计能让 Agent 可靠、高效运行的系统和交互协议。
或许,来自社区的最实用总结能给我们带来最终启示:将 Claude 视为你的员工,你的职责是清晰地分配任务、细致地检查每个任务的产出、并稳健地控制每个步骤的推进。不要试图让 AI Agent 一次性吞下所有需求并自动完成一切,至少在目前的技术阶段,那仍是一个不切实际的目标。成功的 AI 应用,在于人机之间清晰、迭代、可控的协作。





