关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技2025-09-02 00:00:02469人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

全新日产Sentra预想图曝光:造型更激进,三套动力可选

老爷车 浏览 7282 07-14

国产算力占比超 90%,中国联通近 80 亿元采购通用服务器

IT之家 浏览 3779 07-28

利好来袭!深夜,暴涨!

券商中国 浏览 431 09-10

官方:比尔-尼科尔森大门在托特纳姆热刺的新球场正式重新开放

直播吧 浏览 9428 07-26

俄8.7级地震引发海啸日本17地预警 首相呼吁迅速避难

每日经济新闻 浏览 1033 07-30

吴京的《镖人》有救了,陈丽君要来补拍?比被除名的女主角更适合

最爱酷影视 浏览 490 08-24

宝妈32万出售劳力士表 线下交易1个小时后账户被冻结

扬子晚报 浏览 6174 07-29

与冯德莱恩通话后 特朗普同意推迟加税

浏览 2593 07-14

恒大系崩溃,恒大冰泉没有

斑马消费 浏览 498 08-19

追光|婵宝、莎莎、“大头”喊你买土鸡蛋?别信,那是AI伪造的

新华社 浏览 466 08-23

好莱坞传奇落幕!雷德福辞世,圣丹斯精神永流传

情感大头说说 浏览 462 09-18

德媒:面对美军进逼 委内瑞拉亮出俄制武器

参考消息 浏览 319 11-04

媒体人:国安完败内部问题可能有点吓人,外援起不到核心作用

懂球帝 浏览 3346 07-27

百亿私募大佬但斌有了"新身份":中国香港居民

每日经济新闻 浏览 465 10-09

一群人闯进女子刚买的新房砸了两面墙 物业称出于好心

杭州交通918 浏览 243 04-10

马科斯与特朗普见面被指空手而归 美对菲关税仅下降1%

环球网资讯 浏览 9215 07-24

记者手记:一场中欧科学家关于创新的“双向奔赴”

新华社 浏览 5951 07-26

FC26官方英超U21球员评分榜:科尔克兹、萨维尼奥82最高

直播吧 浏览 353 09-10

软银集团20亿美元入股英特尔

环球网资讯 浏览 554 08-19

印尼爆发大规模抗议 当地华人:多位政要住宅被洗劫

封面新闻 浏览 585 09-02

库明加认为接受两年合同+放弃交易否决权 会让勇士掌握过多控制权

直播吧 浏览 6263 07-31
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11