关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技2025-09-02 00:00:02376人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中法两国元首举行会谈 马克龙提出"力争每年访华一次"

环球网资讯 浏览 318 12-05

京东入局具身智能:领投千寻智能、逐际动力、众擎机器人

澎湃新闻 浏览 7803 07-21

感动中国年度人物揭晓 有人舍弃40万元蟹笼救16名渔民

环球网资讯 浏览 555 08-17

破2亿身家!莎拉波娃的"胜负脑"

界外编辑部 浏览 342 09-01

涉世贸组织谈判 商务部:将不寻求新的特殊和差别待遇

界面新闻 浏览 341 09-25

沉默的荣耀大结局前瞻,最惨角色出炉,果然不幸的人各有各的不幸

娱乐圈笔娱君 浏览 311 10-17

环球:印度外长5年来首次访华 双方有鲜明的共识

环球网资讯 浏览 2198 07-15

保时捷战略调整:加码内燃机车型 电动化进程放缓

网易汽车 浏览 341 09-23

美无人机出现在委内瑞拉近海

北青网-北京青年报 浏览 195 12-11

合资反攻潮中的“一个福特”

远川研究所 浏览 299 10-02

37岁白人女子送娃上学被执法人员枪杀 特朗普:是自卫

每日经济新闻 浏览 218 01-11

鸿蒙智行首款MPV,交给智界,能做起来吗?

正在说车 浏览 1039 08-13

89年青年川商“出手”,成都汉唐云将入主一家江苏上市公司!

红星资本局 浏览 2450 07-17

特斯拉车顶维权女车主终审败诉,被判赔偿17万元,媒体人封某被判赔偿25万元

红星资本局 浏览 8842 07-12

詹姆斯下家赔率:湖人第1&骑士第2 独行侠勇士紧随其后

直播吧 浏览 6096 07-12

登贝莱:踢什么位置教练说了算,我很喜欢中锋位置

懂球帝 浏览 325 09-29

AI与FOF投资深度融合:多位行业大咖共探机遇与挑战

私募排排网 浏览 10499 07-30

无敌!樊振东收获乒超第二阶段4连胜,本赛季乒超11战11胜

直播吧 浏览 5038 07-27

不是你胖,是你裤子没挑对!这10条瘦到离谱!

Yuki女人故事 浏览 4371 07-06

媒体:海地街头黑帮堪比正规军 瞧瞧美国人干的好事

澎湃新闻 浏览 10186 08-05

媒体人:北控正在接触德瑞恩-西布龙 曾和鹈鹕签过双向合同

直播吧 浏览 355 09-01
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11