关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技2025-09-02 00:00:02200人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

阿根廷航空节期间一轻型飞机坠毁 至少2人死亡

极目新闻 浏览 160 09-15

长沙不雅视频女医生同款睡裙22万人买 幕后偷拍者披露

壹月情感 浏览 45 11-10

“童颜针”纷争再起!爱美客收割渠道,江苏吴中沦为炮灰?

野马财经 浏览 7447 07-27

寒武纪股价破千,芯片发力猛冲

IPO日报 浏览 259 08-21

“苹果官方闹乌龙”是个乌龙新闻:微博客户端bug导致与三星广告错位

快科技 浏览 9655 07-31

快讯|京东与锦江酒店达成合作 覆盖1.37万家门店

网易科技报道 浏览 194 09-10

恭喜!浙江队外援卢卡斯社媒晒照,与妻子迎来二胎

直播吧 浏览 1410 07-16

中国峰会|奕斯伟计算以“产品+场景+生态协同”模式加速产业渗透

华商韬略 浏览 4600 07-18

WAIC前线|摩尔线程张建中:为AGI时代造生产模型的“超级工厂”

网易科技报道 浏览 6006 07-27

伊姐周六热推:电视剧《树影迷宫》;电视剧《锦月令》......

伊周潮流 浏览 52 11-02

男子50多万买66台苹果手机放平台出租 如今钱机都没了

潇湘晨报 浏览 51 11-10

普通人穿衣其实不用太贵,这些基础单品才最实用,百搭又舒适

静儿时尚达人 浏览 9466 06-09

女喜人也太难了,但也太棒了!

时尚COSMO 浏览 10 12-11

程强:外部冲击下市场波动加剧

首席经济学家论坛 浏览 108 10-15

最高相差上千元!中转机票的羊毛能“薅”吗?

中新经纬 浏览 136 10-02

阿维塔董志华:小而微的人机交互应用场景借大算力被智能重构

贝壳财经 浏览 9575 07-12

牛弹琴:法国又乱套了 乱得匪夷所思

现代快报 浏览 8831 07-22

妻子带着偏瘫丈夫跑半挂:能看见彼此 心里就是踏实的

红星新闻 浏览 220 09-20

20万内的特斯拉要来了?廉价版Model Y大曝光

爱驾天下 浏览 7668 08-08

金价再创新高,突破3610美元/盎司

国际金融报 浏览 198 09-09

体育精神的本质:竞技场上没有“谦让”二字

网球之家 浏览 1205 07-17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11