查询
| 恒生指数1 | 25,249.48 | 0.00 | -- |
| 国企指数1 | 8,483.95 | 0.00 | -- |
| 返回 放大 + 缩小 - | |
|
蚂蚁集团夥清华大学发布开源强化学习训练框架AReaL v1.0稳定版
2026-03-04 14:52:06 蚂蚁集团联合清华大学发布开源强化学习训练框架AReaL v1.0稳定版,主打「Agent一键接入RL训练」,不用改代码,兼容各类Agent框架,让智能体强化学习训练开箱即用。 AReaL是首个全异步训推解耦的大模型强化学习训练系统,能让Agent在真实任务交互中获得反馈、持续优化决策。此次发布的v1.0版本让任意Agent零改造接入RL训练成为现实,即通过在智能体与训练系统之间加入Proxy Worker中转层,开发者只需修改一个请求地址即可接入训练。(jl/w)~ 阿思达克财经新闻 网址: www.aastocks.com | |