AI 研究员提示词工具箱:技巧与实效分析
本文基于一份据称来自 AI 研究员的提示词清单,通过 Claude 的自我评价,将相关技巧分为确实有效、效果因场景而异和被高估三类进行解析,并指出其核心在于为模型提供清晰的结构与约束。

近期,一份据称采访了 12 位来自 OpenAI、Anthropic 和 Google 的 AI 研究员后总结出的 10 个提示词清单在社交媒体上广泛传播。这份清单引发了讨论,而更有趣的是,有用户让 Claude 模型对这些技巧进行了自我评价,得到了一份坦诚的分析。这促使我们审视这些被包装为“研究员内部秘密”的技巧,究竟哪些具有实际效用,哪些可能被高估。
核心内容
根据 Claude 的评价与分析,这些提示词技巧可以大致分为三类。
确实有效的技巧
这类技巧有明确的研究支撑,能显著提升模型在特定任务上的表现。
- 展示推理过程与思考预算:两者本质相同,即要求模型将思维链条外化。这在数学、逻辑和复杂分析任务上效果显著。给予模型更多的 token 进行思考,确实能换来更高质量的推理。
- 验证链:要求模型先回答问题,再列出可能出错之处,最后进行自我修正。这种内置的自我纠错机制能有效捕获模型原本可能自信犯下的错误。
- 对抗性质询:让模型反驳自己的答案。这有助于避免模型成为用户观点的简单回音壁,因其天生具有过度自信倾向,此技巧能迫使其保持智识上的诚实。
- 边缘案例猎手:在代码审查和系统设计等任务中特别有用,能帮助暴露模型的认知盲点。
效果因场景而异的技巧
这类技巧的效用高度依赖于具体任务和指令的明确程度。
- 约束强制:确实能让输出更简洁。
- 不要使用模糊语言:在去除输出中的冗余废话方面效果出奇。
- 比较协议:当用户指定了明确的比较维度时效果更好,否则模型可能会选择对自己而言更便利的角度进行比较。
- 不确定性量化:模型可以给出置信度数字,但这些数字更多是一种未经校准的“感觉”,宜作为方向性参考,不宜过分当真。
被高估的技巧
这类技巧对模型核心能力的提升有限,其作用常被夸大。
- 专家角色扮演:例如“你是一位有 15 年经验的资深专家”这类设定,大部分情况下只是一种表演。模型要么具备该领域的知识,要么不具备,角色设定可能略微改变输出语气,但不会解锁隐藏的知识或能力。
- 格式锁定:例如要求输出 JSON 格式,这本质上是正确使用工具的方式,而非特殊的提示词技巧。
价值与影响
从这些技巧的分析中可以得出一个核心的元教训:最有效的提示词都在做同一件事——为模型提供结构和约束。清晰的预期能够带来清晰的输出,这与管理者给出清晰需求是相通的道理。这些被讨论的技巧,其本质是实用的沟通原则,而非不为人知的研究员秘籍。它们的传播部分是为了获取流量,但剥离包装后,其中关于如何与大型语言模型进行清晰、结构化沟通的见解,对于提升提示工程的实际效果具有参考价值。真正的提升不在于寻找“秘密咒语”,而在于理解并应用好的沟通方式。
来源:黑洞资源笔记



