关闭广告

大规模强化学习框架RLinf!清华、北京中关村学院、无问芯穹等开源

机器之心Pro2025-09-01 12:00:01467人阅读

机器之心报道

机器之心编辑部

清华大学、北京中关村学院、无问芯穹联合北大、伯克利等机构重磅开源RLinf:首个面向具身智能的“渲训推一体化”大规模强化学习框架。



人工智能正在经历从 “感知” 到 “行动” 的跨越式发展,融合大模型的具身智能被认为是人工智能的下一发展阶段,成为学术界与工业界共同关注的话题。

在大模型领域,随着 o1/R1 系列推理模型的发布,模型训练的重心逐渐从数据驱动的预训练 / 后训练转向奖励驱动的强化学习(Reinforcement Learning, RL)。OpenAI 预测强化学习所需要的算力甚至将超过预训练。与此同时,能够将大规模算力高效利用的 RL infra 的重要性也日益凸显,近期也涌现出一批优秀的框架,极大地促进了该领域的发展。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

亚洲杯:中国台北男篮大胜约旦进八强战伊朗 陈盈骏15分贺丹18分

醉卧浮生 浏览 579 08-12

王鸥又曝猛料!爆料对象竟是相声演员?

策略剖析 浏览 10737 07-21

贵阳发生小米SU7逆行与行人碰撞车祸

网易汽车 浏览 549 05-19

罗马诺:曼联认为巴莱巴个人协议不成问题,但和布莱顿谈很难

懂球帝 浏览 8548 08-07

詹卢卡-曼奇尼已为罗马打进21球,为队史进球第二多的后卫

懂球帝 浏览 118 05-06

主要针对能源企业,仍然保留对话空间,俄称已对美欧制裁形成“免疫力”

环球网资讯 浏览 344 10-24

57国统一战线之际内塔尼亚胡叫板中国 指望美国撑腰

科技有趣事 浏览 446 09-18

特朗普与普京长时间通话 “会晤”与“战斧”成话题

极目新闻 浏览 364 10-17

能换电池还能焊模块的手机来了

IT之家 浏览 275 01-27

直播带货保健品两场卖3000多万被骂 "晴格格"王艳回应

极目新闻 浏览 620 08-24

外卖补贴大战刺激骑手收入提升,平台公布数据7月周末骑手日收入增长111%

封面新闻 浏览 1993 07-13

传OpenAI年化收入达120亿美元,ChatGPT周活跃用户达7亿

华尔街见闻官方 浏览 4664 07-31

蒋欣节目中直言自己没人追,理想型竟然是他!

青史楼兰 浏览 323 11-08

美联储9月降息概率大增,A股牛市步伐会加快吗?

郭施亮 浏览 540 08-11

民用航空法修订草案将二审

红星新闻 浏览 6327 06-23

2025前沿科学创新大会发布“人类面临的前100大挑战”全球问题征集

环球网资讯 浏览 7003 07-13

配置升级 2026款起亚嘉华将于9月1日上市

车质网 浏览 446 08-20

关于比特币,你可能不知道的(一)

虎嗅APP 浏览 1438 07-17

50多岁女人不要“装嫩”,掌握这些搭配原则,衣品提升一大截

静儿时尚达人 浏览 355 11-04

世界人形机器人运动会周四开幕!宇树、天工等确认参赛 这些项目值得一看

财联社 浏览 2270 08-14

一张包装纸和一枚硬币背后的“AI加速度”

文汇报 浏览 5207 07-16
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11