推理能力专题

共 2 篇文章，按时间倒序展示。

Gemma 4 长程逻辑推理能力测试观察

一项针对 Gemma 4 的维吉尼亚密码破解测试显示，该模型在明确指令下可进行长时间深度推理，并在无法解决时选择诚实拒绝而非编造答案，其思维深度具有可调节特性。测试也引发了关于如何更全面评估模型原生推理能力与效率的讨论。

2026年04月08日TechFoco

本文介绍了从 Qwen 基础模型出发，通过 GRPO 算法、监督微调及强化学习，逐步构建并优化 DeepSeek R1 模型推理能力的完整流程。

2025年02月26日TechFoco