参考指南

近日，浙江大学硕士生张盛佳和所在团队发现：深度推理模型的部分推理过程是不必要的。一方面，目前的深度推理模型在面对一些例如“1+1=？”的简单问题时，也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时，往往能够凭直觉给出答案；另一方面，在一些简单任务上（例如，常识问答和小学生数学题），即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案，使得深度推理大模型在解决问题时，能够自行决定是否进行深度思考，有利于计算资源更加合理的分配，提升大模型的推理效率。

图 | 张盛佳（来源：张盛佳）

据介绍，受限于数据与算力的规模，预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么，该如何进一步提升大模型的能力？近来，以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制，通过增加测试时计算资源的投入，在多种复杂任务上取得了优异的效果。与非深度推理大模型相比，深度推理大模型通过模仿人类进行深度思考，能够更加准确地理解用户的需求，更加深入地分析用户提出的问题。

然而，目前的深度推理

研究人员提出OThink-R1，让大模型自行决定是否需要深度思考

醒醒吧！ “...

小儿子拜师少...

法国这两天又...

苹果大连百年...

足球报：城市...

端侧AI芯片...

偏股基金经理红黑榜！百亿顶流哪家强，广发王明旭回报垫底

杨幂新剧再受争议？林永健就是“老农民”天花板

马卡：姆巴佩在皇马达成50球里程碑，本赛季点球命中率显著提升

李想的“阳谋”：用VLA司机大模型构建随车代驾

AI，还有一个大漏！

比亚迪唐9系旗舰SUV测试要从BBA嘴里＂抢肉吃＂？

从桔梗裙到流光裙，慵懒又显瘦，微胖女生闭眼入！

抢占“金九银十”先机车企纷纷在沪发布新车

国乒再添一喜！孙颖莎王曼昱被清华大学拟录取，双子星推免直硕

德天空：若无法签下埃德森，加拉塔萨雷将转攻迪奥戈-科斯塔

媒体：联手东盟、日韩中国正为下一轮对美谈判做准备

汪东城回应不结婚：曾以结婚目的交往，却在不知情下当“第三者”

规模效应开始显现，古茗半年净利润超去年全年：三条业绩“驱动链”能否抵御下半年行业风险？

陈涛：我们最后四轮赛程可以用地狱级来形容，已经没有退路了

公职人员干副业会成为一种趋势吗？！

想看人数断层第一，电影《731》却悄然退出了暑期档！

前华为升腾总裁许映童创办的思格新能源冲刺港股：4个月营收12亿

伊朗高级将领：若遭美国攻击以色列将成为首要报复目标

2025最狠理财，惊呆百万散户！

黄奕女儿被网友抵制出道，黄奕：喜欢而已没出道

特斯拉智能辅助驾驶里程已超100亿公里

“韩版英伟达”融资数亿美元，Cerebras获巨资冲刺IPO

首尔明洞等地区出现反华集会中方向韩方提严正交涉

巴黎客战布雷斯特：阿什拉夫、巴尔科拉首发，登贝莱替补