参考指南

近日，浙江大学硕士生张盛佳和所在团队发现：深度推理模型的部分推理过程是不必要的。一方面，目前的深度推理模型在面对一些例如“1+1=？”的简单问题时，也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时，往往能够凭直觉给出答案；另一方面，在一些简单任务上（例如，常识问答和小学生数学题），即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案，使得深度推理大模型在解决问题时，能够自行决定是否进行深度思考，有利于计算资源更加合理的分配，提升大模型的推理效率。

图 | 张盛佳（来源：张盛佳）

据介绍，受限于数据与算力的规模，预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么，该如何进一步提升大模型的能力？近来，以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制，通过增加测试时计算资源的投入，在多种复杂任务上取得了优异的效果。与非深度推理大模型相比，深度推理大模型通过模仿人类进行深度思考，能够更加准确地理解用户的需求，更加深入地分析用户提出的问题。

然而，目前的深度推理

研究人员提出OThink-R1，让大模型自行决定是否需要深度思考

退钱！官方：...

姐弟恋到底幸...

倪妮告秦雯和...

牛弹琴：特朗...

名爵MG4 ...

黄仁勋谈小米...

魅族获奔驰订单？

＂佛门CEO＂释永信被查进入少林寺时一片破败香火不旺

普通人夏天应该怎么穿衣？多穿基础色和基础款，简单又得体

全新日产Sentra预想图曝光：造型更激进，三套动力可选

国产算力占比超 90%，中国联通近 80 亿元采购通用服务器

利好来袭！深夜，暴涨！

官方：比尔-尼科尔森大门在托特纳姆热刺的新球场正式重新开放

俄8.7级地震引发海啸日本17地预警首相呼吁迅速避难

吴京的《镖人》有救了，陈丽君要来补拍？比被除名的女主角更适合

宝妈32万出售劳力士表线下交易1个小时后账户被冻结

与冯德莱恩通话后特朗普同意推迟加税

恒大系崩溃，恒大冰泉没有

追光｜婵宝、莎莎、“大头”喊你买土鸡蛋？别信，那是AI伪造的

好莱坞传奇落幕！雷德福辞世，圣丹斯精神永流传

德媒：面对美军进逼委内瑞拉亮出俄制武器

媒体人：国安完败内部问题可能有点吓人，外援起不到核心作用

百亿私募大佬但斌有了＂新身份＂：中国香港居民

一群人闯进女子刚买的新房砸了两面墙物业称出于好心

马科斯与特朗普见面被指空手而归美对菲关税仅下降1%

记者手记：一场中欧科学家关于创新的“双向奔赴”

FC26官方英超U21球员评分榜：科尔克兹、萨维尼奥82最高

软银集团20亿美元入股英特尔

印尼爆发大规模抗议当地华人：多位政要住宅被洗劫

库明加认为接受两年合同+放弃交易否决权会让勇士掌握过多控制权