关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技2025-09-02 00:00:02461人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

加纳乔执意留在英超,维拉有意引进!埃梅里或用大马丁与曼联交换

罗米的曼联博客 浏览 3814 07-17

宝马车商场停8101小时费用16900元 车主至今未开走

红星新闻 浏览 318 02-05

具身智能,为何成为智驾公司的下一个战场?

雷峰网 浏览 419 09-26

定位紧凑型SUV 示界06将于5月内上市

车质网 浏览 513 05-09

推动AI落地,最不能忽视的10个问题是什么?

钛媒体APP 浏览 4277 07-30

意媒:罗马正在评估引进斯特林的可行性,可能提出租借方案

懂球帝 浏览 284 01-29

“阿尔茨海默病手术”被叫停 已在上百家医院开展

财联社 浏览 6606 07-11

同是星二代,陈飞宇的美梦却成张若昀的 “噩梦”

黄小仙的搞笑视频 浏览 3815 08-09

一旦安世半导体分裂,最后谁会哭?

禾颜阅车 浏览 285 11-10

德约科维奇闭关备战地点被发现,今天将空降纽约训练

网球之家 浏览 468 08-19

奔驰中国销量快速下滑,大奔现在不受欢迎了?

江瀚视野 浏览 1477 07-22

消息人士透露结束俄乌冲突方案 俄方要求"440换6600"

红星新闻 浏览 623 08-19

中方:对12家美国实体停止执行出口管制管控措施

界面新闻 浏览 6731 08-12

新能源销量半年报:折腾了半天,电车还是“杀不死”油车

汽车公社 浏览 1848 07-11

AI生成内容必须“亮明身份”!微信、腾讯元宝已出手

每日经济新闻 浏览 449 09-01

英国计划推出新举措,多方面发力促进电动汽车销售

IT之家 浏览 2479 07-14

高市早苗:若执政党阵营在选举中未过半数 将即刻辞职

界面新闻 浏览 278 01-27

【央行重磅出手】5000亿资金落地!中信银行、兴业银行、民生银行等六大商业银行企业融资黄金窗口开启

闺蜜财经 浏览 467 09-02

外资巨头高盛刷屏!再次上调寒武纪目标价至2104元,上半年“扫货”196只A股

红星资本局 浏览 495 09-02

深度复盘:大疆是如何成为影像领域新巨头的?

极客公园 浏览 332 11-12

众安在线上半年归母净利润同比增长1103.5%,股东位次已洗牌

蓝鲸Insurance 浏览 521 08-21
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11