参考指南

近日，浙江大学硕士生张盛佳和所在团队发现：深度推理模型的部分推理过程是不必要的。一方面，目前的深度推理模型在面对一些例如“1+1=？”的简单问题时，也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时，往往能够凭直觉给出答案；另一方面，在一些简单任务上（例如，常识问答和小学生数学题），即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案，使得深度推理大模型在解决问题时，能够自行决定是否进行深度思考，有利于计算资源更加合理的分配，提升大模型的推理效率。

图 | 张盛佳（来源：张盛佳）

据介绍，受限于数据与算力的规模，预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么，该如何进一步提升大模型的能力？近来，以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制，通过增加测试时计算资源的投入，在多种复杂任务上取得了优异的效果。与非深度推理大模型相比，深度推理大模型通过模仿人类进行深度思考，能够更加准确地理解用户的需求，更加深入地分析用户提出的问题。

然而，目前的深度推理

研究人员提出OThink-R1，让大模型自行决定是否需要深度思考

何润东突然爆...

租电 29....

多人手机信号...

具俊晔在大S...

Arm财报逊...

新华社点名杨...

卡萨诺：佛罗伦萨请皮奥利是糟糕的决定，我曾建议他们请伊劳拉

45岁大威笑谈复出：为了医保我必须回来打，我总看医生很需要这个

王毅同鲁比奥通电话：美干涉了中国内政中方明确反对

一周AI大事：Grok 4硬刚GPT-5，英伟达破纪录

大爷奔现后吃野菜度日：女友自称老板会给我买房买车

人无完人，金无足赤！年轻时美炸天的港台女神，各有各的缺点

小伙雕刻＂全球首个汽车石窟＂曾雕＂奥特曼＂石窟引争议

多地兴起＂假装上班＂工位：没工资租金20~30元/天

下周关注｜进博会等多个重要活动将举办, 这些投资机会最靠谱

海博思创400多亿市值背后，留美博士张剑辉的逆袭之路

首个旅游行业超级智能体马蜂窝”AI路书“正式上线

无止境，梅西常规赛28场贡献29球16助攻

她不靠穿搭谋生，却因穿搭走红，在穿衣上找到主体性是什么体验？

阅兵准备基本就绪已经进入倒计时

搭载1.5T增程动力风云X3L将于9月9日上市

杜海涛用P图回应秃头：我有很多头发，不接受反驳

‍22个观众，首日票房仅825元，这部国产烂片被《731》打惨了

世体：姆巴佩顺利通过考试，已拿到驾照

英伟达最新芯片B30A曝光

美团将与商家共建超 1 万家卫星店：明厨亮灶，更专注于外卖服务

挑战苹果，国产屏下前摄、屏下 3D 人脸机型被曝均已进版实验室

特斯拉陶琳：印度首批Model Y交付，全部来自特斯拉上海工厂

A股市值破100万亿，但“牛市”含金量不高，三个信号意味深长

泰国代理总理发声：柬埔寨没有表现出诚意