关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技2025-09-02 00:00:02372人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

“岭南中医药文化传承周”在京启幕!广药非遗亮相中国非遗馆

伯虎财经 浏览 1762 07-17

女大避父!倪萍戳穿董璇半路夫妻的残酷

科学发掘 浏览 9473 08-07

百度蒸汽机视频大模型7折价入局

北京商报 浏览 414 08-22

三伏贴怎么贴才有效?这些事项要注意

人民网 浏览 8847 07-26

乌克兰组建与俄谈判代表团

界面新闻 浏览 788 07-23

特朗普:可能很快宣布美联储新任主席

证券时报e公司 浏览 5443 08-06

微软秘密武器亮相,英伟达CUDA护城河遭遇直接冲击

IT之家 浏览 206 11-10

泰柬冲突柬方70人死伤 泰国近20万人住进避难中心

财联社 浏览 192 12-12

两外卖小哥街头包抄挡下偷车贼 警方寻人3个月找到了

红星新闻 浏览 416 09-01

记者:加拉塔萨雷再次拒绝科莫对莫拉塔的报价,球队视他为关键

直播吧 浏览 9848 07-31

大S妈妈晒自拍照,重拾对生活的信心,率领S家人过新生活

素素娱乐 浏览 134 03-10

特朗普:可能接管伊朗的哈梅内伊接班人 在空袭中丧生

扬子晚报 浏览 145 03-03

马绩效:尤文对皇马机会多但把握差,很难说这就是积极的表现

懂球帝 浏览 264 10-24

岁月不败美人,58岁的妮可·基德曼比20岁的她更好看

LinkFashion 浏览 2778 07-24

王宝强没想到,和马蓉离婚9年后,自己的一双儿女开始为他争光了

TVB的四小花 浏览 291 09-21

从韧带撕裂到冠军加冕:布瓦松的逆袭童话

网球之家 浏览 9917 07-22

中国战轰挂弹拦截日本侦察机 日本:此事绝不准再发生

博览历史 浏览 2855 07-12

特朗普威胁:将每天给大约10个国家发送信件 接关税吧

澎湃新闻 浏览 5643 07-05

还要涨价!涨了5毛钱后,康师傅饮料少卖7亿,但管理层称不会降价,500ml装也要涨

时代周报 浏览 4637 08-14

卷入网络风波后,吴京公开发文,评论区又被玩梗

皮皮电影 浏览 334 09-06

亚洲首个跨境输电的新能源项目投运

IT之家 浏览 3170 07-27
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11