关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技2025-09-02 00:00:02373人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

李想的“阳谋”:用VLA司机大模型构建随车代驾

网易汽车 浏览 446 05-10

AI,还有一个大漏!

市值Observation 浏览 10530 07-25

比亚迪唐9系旗舰SUV测试 要从BBA嘴里"抢肉吃"?

车矩阵更懂车 浏览 195 01-25

从桔梗裙到流光裙,慵懒又显瘦,微胖女生闭眼入!

Yuki女人故事 浏览 7853 06-19

抢占“金九银十”先机 车企纷纷在沪发布新车

看看新闻Knews 浏览 437 08-20

国乒再添一喜!孙颖莎王曼昱被清华大学拟录取,双子星推免直硕

乒谈 浏览 191 10-31

德天空:若无法签下埃德森,加拉塔萨雷将转攻迪奥戈-科斯塔

直播吧 浏览 416 08-20

媒体:联手东盟、日韩 中国正为下一轮对美谈判做准备

澎湃新闻 浏览 3057 07-13

汪东城回应不结婚:曾以结婚目的交往,却在不知情下当“第三者”

扒虾侃娱 浏览 10606 07-24

规模效应开始显现,古茗半年净利润超去年全年:三条业绩“驱动链”能否抵御下半年行业风险?

每日经济新闻 浏览 398 08-28

陈涛:我们最后四轮赛程可以用地狱级来形容,已经没有退路了

懂球帝 浏览 302 10-13

公职人员干副业会成为一种趋势吗?!

识局 浏览 5965 07-30

想看人数断层第一,电影《731》却悄然退出了暑期档!

电和影 浏览 1758 07-30

前华为升腾总裁许映童创办的思格新能源冲刺港股:4个月营收12亿

雷递 浏览 348 09-09

伊朗高级将领:若遭美国攻击 以色列将成为首要报复目标

极目新闻 浏览 160 02-05

2025最狠理财,惊呆百万散户!

米筐投资 浏览 188 11-05

黄奕女儿被网友抵制出道,黄奕:喜欢而已没出道

情感大头说说 浏览 9815 08-06

特斯拉智能辅助驾驶里程已超100亿公里

大象新闻 浏览 216 11-27

“韩版英伟达”融资数亿美元,Cerebras获巨资冲刺IPO

DeepTech深科技 浏览 297 10-02

首尔明洞等地区出现反华集会 中方向韩方提严正交涉

新京报 浏览 5502 07-11

巴黎客战布雷斯特:阿什拉夫、巴尔科拉首发, 登贝莱替补

懂球帝 浏览 273 10-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11