关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技2025-09-02 00:00:02465人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

一周AI大事:Grok 4硬刚GPT-5,英伟达破纪录

网易科技报道 浏览 7093 07-14

大爷奔现后吃野菜度日:女友自称老板 会给我买房买车

小莉帮忙 浏览 86 06-02

人无完人,金无足赤!年轻时美炸天的港台女神,各有各的缺点

温柔娱公子 浏览 4283 08-10

小伙雕刻"全球首个汽车石窟" 曾雕"奥特曼"石窟引争议

封面新闻 浏览 341 11-03

多地兴起"假装上班"工位:没工资 租金20~30元/天

极目新闻 浏览 650 08-21

下周关注|进博会等多个重要活动将举办, 这些投资机会最靠谱

第一财经资讯 浏览 339 11-03

海博思创400多亿市值背后,留美博士张剑辉的逆袭之路

尺度商业 浏览 265 12-23

首个旅游行业超级智能体马蜂窝”AI路书“正式上线

网易科技频道 浏览 9409 07-12

无止境,梅西常规赛28场贡献29球16助攻

懂球帝 浏览 343 10-19

她不靠穿搭谋生,却因穿搭走红,在穿衣上找到主体性是什么体验?

黎贝卡的异想世界 浏览 288 11-08

阅兵准备基本就绪 已经进入倒计时

新华社 浏览 405 08-29

搭载1.5T增程动力 风云X3L将于9月9日上市

车质网 浏览 504 08-18

杜海涛用P图回应秃头:我有很多头发,不接受反驳

极目新闻 浏览 479 08-22

‍22个观众,首日票房仅825元,这部国产烂片被《731》打惨了

靠谱电影君 浏览 386 09-29

世体:姆巴佩顺利通过考试,已拿到驾照

懂球帝 浏览 245 03-03

英伟达最新芯片B30A曝光

量子位 浏览 513 08-20

美团将与商家共建超 1 万家卫星店:明厨亮灶,更专注于外卖服务

IT之家 浏览 4032 07-16

挑战苹果,国产屏下前摄、屏下 3D 人脸机型被曝均已进版实验室

IT之家 浏览 5194 08-09

特斯拉陶琳:印度首批Model Y交付,全部来自特斯拉上海工厂

盖世汽车 浏览 377 09-29

A股市值破100万亿,但“牛市”含金量不高,三个信号意味深长

智谷趋势 浏览 463 08-20

泰国代理总理发声:柬埔寨没有表现出诚意

财联社 浏览 4335 07-29
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11