TechFoco Logo
首页专题归档站点地图
© 2026 TechFoco. All rights reserved.
文章归档专题网站地图站点地图 XML爬虫规则GitHub
  1. 首页
  2. /
  3. 返回归档
  4. /
  5. 抛弃Function Calling:用Unix命令行作为AI Agent的原生工具

抛弃Function Calling:用Unix命令行作为AI Agent的原生工具

2026年03月19日•TechFoco 精选

前Meta收购公司Manus的后端技术负责人分享经验,主张用简单的`run(command)`工具配合Unix命令行替代复杂的Function Calling,并阐述了其背后的启发式设计原则与工程架构。

Article Image
Article Image

在 AI Agent 的开发实践中,Function Calling 或 Tool Calling 作为一种主流范式,被广泛用于为大语言模型提供结构化工具调用能力。然而,前 Meta 收购公司 Manus 的后端技术负责人 Morro Hsu 在经历两年构建 AI Agent 的实践后,提出了一个颠覆性的观点:应放弃复杂的 Function Calling,转而采用一个简单的 run(command) 工具,配合 Unix 命令行来驱动 Agent。这一思路挑战了当前依赖庞大、结构化专用工具库的常见做法。

核心内容

Morro Hsu 的核心论点是,大语言模型在数十亿行代码的训练数据中,早已对 Unix 命令行及其组合方式有了深刻理解。因此,使用命令行作为交互接口,比设计大量专用函数更符合 LLM 的“思维模式”。

他将这种基于命令行的模式总结为“启发式设计”,其核心包含三个原则:

  1. 渐进式 --help 发现:Agent 无需在初始阶段加载所有工具的完整文档。它可以像人类用户一样,先调用基础命令(如 memory)查看用法,再根据需要探索具体子命令(如 memory search)。这种按需探索的方式,能极大节省宝贵的上下文长度。
  2. 把错误信息当导航:传统的命令行错误信息对 LLM 帮助有限。Hsu 的设计会返回导航式错误信息。例如,当 Agent 错误地使用 cat 命令读取图片时,系统会返回 [error] cat: binary image file. Use: see photo.png,直接指明下一步操作,避免 Agent 盲目重试。他分享了一个案例:由于标准错误流被静默,一个 Agent 在安装软件包时,在 pip、uv、apt 等命令间盲目重试了 10 次,浪费了大量时间和 Token。
  3. 两层架构:这是关键的工程洞察。命令的执行(执行层)与返回给 LLM 的结果(表现层)必须分离。执行层应保持 Unix 管道的原汁原味,确保数据无损传递。而表现层则专门为 LLM 服务,例如自动截断超长输出并告知完整路径、将二进制文件内容替换为提示信息、附加 [exit:0 | 12ms] 等执行元数据。这能防止 LLM 的上下文被无关信息污染,并帮助其学习评估每个命令的执行成本。

Hsu 强调,这一思路并非要给 Agent 一个完整的 Linux 系统,而是使用 LLM 最熟悉、最原生的“语言”与之沟通。他指出,Shell 是超集,可以方便地从 Shell 中调用 Python 代码等功能,反之,在纯代码环境中调用 Shell 命令则可能多绕一段路。

价值与影响

这一分享的价值在于,它将一个看似回归传统(用 Unix CLI 替代时髦的 Function Calling)的技术选择,提升为一种更符合 AI 本质的设计哲学。它不仅指出了“CLI 更好用”的现象,更深入剖析了其背后的原因:训练数据的高度吻合、命令的天然可组合性,以及通过渐进式帮助、导航式报错和分层架构来实现“好用”的具体工程方法。其中,“stderr 是 Agent 最需要的信息”和“Shell 是超集”等观点,为许多仍在复杂工具集中寻找最优解的开发者提供了新的视角,体现了一种工程上的返璞归真。


来源:黑洞资源笔记

相关标签

AI AgentFunction CallingUnix ShellLLM EngineeringBackend Development

继续阅读

较新文章

Sam Altman 推文引发的程序员职业焦虑

较早文章

Sirchmunk:无向量数据库的实时智能搜索方案

相关文章

查看更多
Hermes Agent:开源 AI Agent 框架的设计与实现

Hermes Agent:开源 AI Agent 框架的设计与实现

本文介绍了 Nous Research 发布的 Hermes Agent 开源框架,重点阐述其内建的自改进学习循环、三层记忆系统及 Skill 进化机制,并说明其作为《Harness Engineering》理论首...

2026年04月09日
AI Agent开源框架
当 AI Agent 拥有“克隆”大脑:超越容器的沙盒革命

当 AI Agent 拥有“克隆”大脑:超越容器的沙盒革命

本文介绍了一种基于内存写时复制和 MicroVM 的新型虚拟机技术,可实现亚秒级环境克隆,为 AI Agent 的并行决策提供了物理基础,并探讨了其技术优势与潜在挑战。

2026年04月08日
AI Agent虚拟机
Hindsight™:革命性的 AI Agent 记忆系统

Hindsight™:革命性的 AI Agent 记忆系统

Hindsight™ 是一个 AI Agent 记忆系统,旨在解决传统 RAG 或知识图谱在记忆准确率和长期遗忘上的不足,通过自动提取、多路检索和深度反思,让 AI 真正“学会”。

2026年04月08日
AI Agent记忆系统
paper2code:将 ArXiv 论文转化为可运行代码

paper2code:将 ArXiv 论文转化为可运行代码

paper2code 是一款 AI Agent 插件,旨在解决论文复现中因细节模糊导致的效率低下问题。它通过引用锚定和模糊性审计,将论文转化为可追溯、结构完整的代码项目,并明确标注未指定内容。

2026年04月07日
论文复现代码生成
wecom-cli:终端操控企业微信的 AI Agent 工具

wecom-cli:终端操控企业微信的 AI Agent 工具

wecom-cli 是一款通过命令行和 AI Agent 高效操控企业微信的工具,覆盖通讯录、消息、会议等 7 大核心业务,支持 npm 一键安装与快速配置,适合用于自动化办公场景。

2026年04月02日
命令行工具企业微信

DeepSeek 押注 Agent:从“会聊天”到“会干活”

本文基于公开招聘信息,分析了 DeepSeek 公司近期将战略重心转向 AI 智能体(Agent)的动向。文章探讨了 Agent 的核心概念、行业竞争焦点的转移,以及构建可用 Agent 系统所依赖的评测、基础设施...

2026年04月02日
AI AgentDeepSeek