思维链专题

共 3 篇文章，按时间倒序展示。

Gemma 4 长程逻辑推理能力测试观察

一项针对 Gemma 4 的维吉尼亚密码破解测试显示，该模型在明确指令下可进行长时间深度推理，并在无法解决时选择诚实拒绝而非编造答案，其思维深度具有可调节特性。测试也引发了关于如何更全面评估模型原生推理能力与效率的讨论。

2026年04月08日TechFoco

Attentive Reasoning Queries (ARQ) 通过结构化 JSON 查询强制大型语言模型在多轮对话中逐步检查关键信息，在 87 个场景测试中取得了 90.2% 的成功率，有效缓解了模型遗忘规则...

2025年10月26日TechFoco

Lyra 是一套系统化框架，旨在通过结构化的 4D 流程、双模操作和分层技术栈，将模糊的用户需求转化为精确高效的 AI 指令，并封装为可自主运行的提示代理。

2025年09月14日TechFoco