蚂蚁技术研究院发布推理大模型强化学习框架,邀请开发者共同助力 AGI 生态

2 月 27 日
阅读 1 分钟
89
2月25日,蚂蚁技术研究院正式开源强化学习框架 AReaL(Ant Reasoning RL)。AReaL 源自开源项目 ReaLHF,旨在训练每个人都可以复现和贡献的大型推理模型 (LRM)。AReaL 是蚂蚁技术研究院为开发一个完全开放和包容的 AGI 世界迈出的一步。
封面图