Claude Opus 4.5 用户反馈与改进建议
本文整理了用户对 Claude Opus 4.5 的集中反馈,涉及上下文处理、UI 体验、代码生成、安全分析等多个方面的痛点,并指出了模型在稳健性和实用性上的改进方向。
近期,Anthropic 的 Alex Albert 在 X 平台公开征集用户对 Claude Opus 4.5 的反馈。此举旨在收集一线使用者的真实体验,以指导模型的后续迭代。从用户的集中反馈来看,Opus 4.5 虽然在功能上表现强大,但在实际应用中的稳健性、用户体验和技术细节方面,仍面临一系列挑战。
核心内容
用户反馈主要集中在以下几个方面:
1. 上下文处理与稳定性问题 用户报告,模型在处理长上下文时频繁遇到限制,导致查询失败或界面空白。此外,离开页面后输入内容容易丢失,影响了工作流的连续性。在对话过程中,模型有时会表现出“直觉化”倾向,急于下结论而忽略具体指令,缺乏严格的核查过程。用户期望模型能具备更强的“长上下文智能”,能够提炼主题和战略方向,而非进行简单的信息检索。
2. 代码生成与特定场景能力 在代码生成任务中,Opus 4.5 有时会忽视项目中已有的抽象设计,导致“重复造轮子”。在处理合并冲突时,其智能化程度不足,用户需要等待 CI 流程失败后才能发现问题。在安全研究等专业领域,模型对场景的识别能力有待加强,例如会拒绝分析恶意软件样本,限制了其在特定领域的应用。
3. 用户体验与系统功能 用户界面体验存在改进空间,例如无法在同一个会话中灵活切换 Sonnet 和 Opus 模型。自动上下文压缩功能不可控,被认为浪费了时间和计算资源。此外,用户普遍关注模型的性能和成本,期望获得更快、更经济的服务。在功能层面,用户期待能自动生成并维护项目文档(如 CLAUDE .md)、支持异步渐进式上下文压缩,以及增加对视频输入的处理能力。
价值与影响
这些反馈揭示了当前大型语言模型在从“能力展示”走向“生产级应用”过程中所面临的共性问题。核心挑战在于如何在保持模型核心能力(如复杂推理)的同时,大幅提升其稳健性、实用性和对用户意图的精准理解。减少“直觉式”错误,增强对长上下文的深度理解和跨会话的记忆管理,是模型进化的关键。只有当 AI 助手在这些方面得到显著改善,才能从偶尔令人惊艳的工具,转变为日常工作中真正可靠、高效的合作伙伴。此次公开征集反馈,也体现了开发团队对产品实用性的重视,以及通过社区协作推动技术迭代的开放态度。
来源:黑洞资源笔记





