AgentScope:构建可见、可理解、可信赖的智能代理框架
AgentScope 是一个用于构建智能代理的 Python 框架,旨在简化模型推理、工具调用、多代理协作等复杂流程的开发与部署。

共 11 篇文章,按时间倒序展示。
AgentScope 是一个用于构建智能代理的 Python 框架,旨在简化模型推理、工具调用、多代理协作等复杂流程的开发与部署。

OpenEnv 是一个基于 Gymnasium API 的强化学习环境接口库,旨在通过容器化隔离和 WebSocket 通信,简化环境的开发、部署与管理流程。

Datawhale 社区的开源教程《从零开始构建智能体》系统性地介绍了 AI 原生智能体的核心原理与构建方法,旨在帮助开发者从理论理解过渡到实战开发,实现从使用者到构建者的转变。


IR-SIM 是一款基于 Python 的轻量级机器人仿真器,专注于导航、控制和强化学习的快速算法验证。它不依赖复杂物理引擎,通过 YAML 定义场景和 Matplotlib 可视化,简化了算法原型设计流程。

Meta推出的REFRAG技术,通过在嵌入层面对文本块进行压缩,并利用强化学习策略进行相关性筛选,显著减少了送入大语言模型的无关token数量。该方法在提升响应速度、支持更大上下文窗口的同时,保持了模型准确性。

本文梳理了Yann LeCun、Richard Sutton和Ilya Sutskever三位AI专家对实现通用人工智能的不同核心理念,探讨了其各自的技术路径与潜在的融合可能。

Fin-R1是一款专为金融领域设计的7B参数推理大模型,采用SFT和RL两阶段训练,在FinQA和ConvFinQA等金融推理任务上表现优异,旨在提升模型准确性与泛化能力。



本文解析了类似 ChatGPT 的系统如何工作,主要分为模型训练与用户问答两个核心流程。训练阶段包括预训练和基于人类反馈的强化学习微调;问答流程则重点阐述了内容审核机制对输入与输出的双重安全保障。
