关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技2025-09-02 00:00:02467人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

深夜爆雷,大跌!

券商中国 浏览 4231 07-18

陈俊菘3-2泊雷特采访!不满第四局心态问题,将保持意志品质!

篮球资讯达人 浏览 401 10-02

约5.1亿平方公里的地球:卫星如何实现高效高清晰观测?

中国科普博览 浏览 532 08-19

28岁中国留学生海外失联十几天 曾给家人发送信息

环球网资讯 浏览 252 02-02

5555被拒稿,AC接收但PC强拒,NeurIPS揭榜引争议

机器之心Pro 浏览 397 09-20

市场监管总局已约谈主要外卖平台,抵制恶性补贴

界面新闻 浏览 438 09-10

队报:马赛后卫梅迪纳脚踝受伤,将缺席至9月上旬

直播吧 浏览 462 08-22

长城汽车计划再投资元戎启行 金额8亿—10亿元

经济观察报 浏览 1760 07-24

广东惜败巴西!杨溢王浩然大爆发,王少杰顶内线,徐昕杜锋争执!

篮球资讯达人 浏览 4784 07-29

彭小苒的逆袭不止“紫衣杀”

小小敏娱乐 浏览 399 10-28

特朗普按下葫芦亲自去浮瓢:巴以未了结 俄乌又点炮

新民晚报 浏览 409 10-13

阿斯:安东尼将首发出战莱万特,他上一次比赛还是欧协联决赛

懂球帝 浏览 470 09-11

除了吃饱睡好怎么准备今天的比赛的?杨瀚森:喝足

直播吧 浏览 891 07-12

卖一台新车亏1万、靠售后赚54亿“回血”,最大4S集团年报中还藏着哪些机会和隐忧?

AC汽车 浏览 441 09-08

近两月股价涨超130%!先导智能为何能从行业低谷崛起?

览富财经网 浏览 412 09-10

NBA球员生涯正负值历史前十:约基奇历史第一 乔丹詹姆斯分列二三

直播吧 浏览 4744 07-27

直降95万!北京五环外正在上演抢房大战

第一财经资讯 浏览 3786 08-10

独立报:热刺通过中间人询问罗杰斯交易,并准备了8000万英镑

懂球帝 浏览 520 08-22

挪威表态:准备好执行国际刑事法院对以总理的逮捕令

环球网资讯 浏览 5390 08-14

今年最好看的裙子,承包你整个秋天的时髦!

LinkFashion 浏览 395 09-13

吴海燕近况:定居上海丈夫去世半年 71岁气质知性

春序娱乐 浏览 488 08-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11