关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技2025-09-02 00:00:02201人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

东航回应“将开通上海虹桥往返伦敦航班”

财联社 浏览 20632 08-25

巴萨官宣与18岁亚马尔续约 将身穿传奇10号球衣

网易体育 浏览 2761 07-17

TA:从进攻核心到压迫发起点,梅西角色延伸提升球队上限

懂球帝 浏览 16 12-05

扎克伯格,也顶不住了

极客公园 浏览 270 08-23

抗过敏药容易依赖,能不用就不用?错!

网易健康 浏览 2078 06-12

第13次阿辛决,温网今晚巅峰之夜!

网球之家 浏览 597 07-14

鹿晗解禁后首次晒照:染“红发”瘦成皮包骨

讯崽侃天下 浏览 9122 07-13

【现场】两记神仙球射落3分,6连胜皇马仍有提升空间

体坛周报 浏览 175 09-21

带队4战全胜,杭州临平吴越主帅许磊当选中乙6月最佳教练

懂球帝 浏览 2612 07-18

赵露思又发文,这次估计是真不干了

东方不败然多多 浏览 10159 08-03

痔疮的危害千万别忽视!

网易健康 浏览 1789 02-26

成都双流机场西侧这个公园潮流打卡地加速成形

红星新闻 浏览 252 08-25

海南全岛封关倒计时!对你我有何影响?

国是直通车 浏览 9381 07-25

卫报:切尔西不愿满足加纳乔的定价;雅克松的要价为8000万镑

懂球帝 浏览 251 08-20

乐道L90身上写满了蔚来的求生欲

禾颜阅车 浏览 277 08-12

三宝刚吐槽完孙俪,转头就被倪萍拆台

阿废冷眼观察所 浏览 4524 08-05

打砸记者摄像机当事人:确实是冲动了

大象新闻 浏览 3414 07-17

IPO失败后,卖身上市公司又失败!一主要股东因开设赌场罪被判刑

财通社 浏览 212 09-01

以军72小时内袭击叙利亚 黎巴嫩等6国

环球网资讯 浏览 157 09-12

比亚迪腾势 N8L 明年二季度上市,定位插电混动大型 SUV

IT之家 浏览 4519 07-25

银行副行长退休后嫌太闲重新上班:退休金上万 不差钱

时代周报 浏览 276 09-01
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11