Fin-R1：一款7B参数的金融推理大模型

随着大语言模型在通用领域的成熟，其在垂直专业领域的应用需求日益增长。金融领域因其对准确性、逻辑性和合规性的高要求，对专业化的模型提出了挑战。针对这一需求，专为金融推理任务设计的大模型 Fin-R1 应运而生。

核心内容

Fin-R1 是一款参数规模为 7B 的推理大模型，其核心设计目标是高效解决复杂的金融推理问题。模型在关键的金融推理基准测试中取得了显著成绩，例如在 FinQA 任务上得分为 76.0，在 ConvFinQA 任务上得分为 85.0。

为实现高性能，Fin-R1 采用了分阶段的训练策略：

首先进行监督微调（SFT），使模型学习金融领域的专业知识和推理模式。
随后引入强化学习（RL）进行进一步优化，旨在提升模型输出的准确性和泛化能力。

价值与影响

Fin-R1 的推出为金融机构应用 AI 技术提供了新的选择。其 7B 的参数量意味着相对较低的部署和推理成本，有助于在实际业务场景中落地。模型在特定金融任务上的优异表现，展示了领域专用模型在解决专业问题上的潜力。其采用的 SFT 与 RL 结合的训练范式，也为其他垂直领域模型的开发提供了参考思路。