关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技2025-09-02 00:00:02371人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

西贝回应"顾客就餐时用公筷喂狗":店内已全面消杀

界面新闻 浏览 382 09-18

吉利汽车与极氪正式宣布合并;罗马仕旗舰店恢复营业!官方称:召回服务长期有效;英伟达宣布:H20将恢复对中国销售丨雷峰早报

雷峰网 浏览 2598 07-16

今年夏天一定要拥有的10件衣服,怎么搭都时髦!

LinkFashion 浏览 1637 07-16

台前舰长吕礼诗谈九三阅兵:好多装备打台湾根本用不上

环球网资讯 浏览 459 09-08

不让躺平,比卢普斯:利拉德新赛季会是史上薪水最高的助教

懂球帝 浏览 3464 07-22

张家界荒野求生热门选手退赛 连下一周雨致腿部冻伤

极目新闻 浏览 240 10-29

破局出海难题 2025中国(合肥)跨境电商大会开幕

中安在线 浏览 4678 07-31

闫冬|脑机信息隐私属性泛化之反思与规制

上观新闻 浏览 4558 08-13

镁信健康将亮相第八届进博会,发布三大产业级AI应用方案|进距离

上观新闻 浏览 200 11-01

王晶揭谢霆锋张柏芝离婚原因:女方经常边做饭边骂男方

开开森森 浏览 523 08-18

以技术沉淀成就实力蝶变,欧菲光持续引领光学产业发展

时代周报 浏览 485 08-20

《骄阳似我》热度24000,这才是现偶剧该有的样子

娱乐圈笔娱君 浏览 178 12-24

医美并购的“朗姿教训”

阿尔法工场 浏览 4391 07-24

辛芷蕾得奖后,内娱终于要变天了?

独立鱼 浏览 324 09-10

业内人士:裁判作假会在关键判罚偏向该队,不重要判罚偏向对方

直播吧 浏览 2796 07-15

立秋不拼单量拼新品,美团倡导行业回归理性

博望财经 浏览 7594 08-14

鹿晗关晓彤恋爱期间毫不避讳?

娱晓晓 浏览 183 12-21

4.6亿台北豪宅将遭法拍:汪小菲拒还房贷,具俊晔搬离,S妈催款无门

东方不败然多多 浏览 384 09-07

华为芯片核心技术遭窃细节披露:通过手抄和截屏窃取

鲁中晨报 浏览 481 08-19

累计减持超5%,湘财股份撤离大智慧!

独角金融 浏览 3395 07-18

增长遇阻,捷途汽车连续三个月销量下滑?

车秀小咖 浏览 31 04-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11