关闭广告

全新合成框架SOTA:强化学习当引擎,任务合成当燃料

量子位2025-10-02 00:00:02130人阅读

AntResearchNLP团队 投稿
量子位 | 公众号 QbitAI

下一步,大模型应该押注什么方向?

蚂蚁通用人工智能中心自然语言组联合香港大学自然语言组(后简称“团队”)推出PromptCoT 2.0,要在大模型下半场押注任务合成



实验表明,通过“强起点、强反馈”的自博弈式训练,PromptCoT 2.0可以让30B-A3B模型在一系列数学代码推理任务上实现新的SOTA结果,达到和DeepSeek-R1-0528, OpenAI o3, Gemini 2.5 Pro等相当的表现。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中年女人无需盲目追赶潮流!长裙与单鞋的巧妙搭配,绽放魅力

静儿时尚达人 浏览 7722 06-29

这件衣服今年太火了!时髦女人都在穿

LinkFashion 浏览 99 10-23

俄军宣布首次攻入乌中部腹地 阵亡人员遗体交换或推迟

界面新闻 浏览 2681 06-09

中超争冠巨变!申花仅1分领跑,海港看到卫冕希望,国安追分良机

奥拜尔 浏览 4576 08-10

"3女子带4孩续面"涉事双方均称遭到网暴 顾客最新发声

极目新闻 浏览 328 08-18

普通人真该看看这些穿搭!短上衣配裙子、颜色选好,自然得体

静儿时尚达人 浏览 113 10-07

虞书欣又惹争议!活动搞区别对待被怒斥势利

萌神木木 浏览 219 09-08

秋季穿衣原来如此简单!记住这几组穿搭公式,得体简约又耐看

静儿时尚达人 浏览 57 11-01

不先进也不安全,英伟达停产H20

观察者网 浏览 247 08-22

少林寺释永信方丈怎么了?

正经社 浏览 6391 07-28

OpenAI提升ChatGPT Plus用户推理配额,每周3000次GPT-5级推理

IT之家 浏览 249 08-11

多纳鲁马被指责嘲讽引发冲突,以色列球员:他们整场都在侮辱我们

直播吧 浏览 189 09-10

撒贝宁随李白回加拿大探亲,俩人带着龙凤胎闲逛

二妹扯娱 浏览 110 10-18

霍勒迪:杨瀚森一直都是超级巨星,看到他的表现我感到很兴奋

懂球帝 浏览 497 07-30

万千惠评论区沦陷!老公把亲妈训斥哭了她还笑,被网友疯狂吐槽

萌神木木 浏览 210 09-02

特朗普"带货"后 丰田澄清:没承诺在美投资100亿美元

环球时报国际 浏览 68 10-31

郭碧婷爸爸“打脸”向太:郭碧婷一人承担俩孩子开销

青途历史 浏览 97 10-19

“豪宅教父”黄其森被留置,千亿泰禾爆雷6年想上岸更难了

密探财经 浏览 239 08-23

特朗普:将与哈佛大学达成"令人难以置信的"协议

澎湃新闻 浏览 8958 06-22

“朋友圈”越来越大 服贸会“剧透”来了!

中国商报 浏览 160 09-09

0收入,0产品,估值120亿美元

网易科技报道 浏览 2388 07-17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11