关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro2026-02-02 12:00:01170人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

胜利精密连续亏损三年半,主营业务毛利率回升,公司称历史包袱基本解决

时代周报 浏览 440 08-20

续火花:不间断的敷衍,就是真诚

时尚COSMO 浏览 185 12-10

两大巨头女掌舵人相继宣布卸任,跨国企业面临新一轮调整

第一财经资讯 浏览 281 10-01

爆料杨采钰知三当三失败,豪门梦破碎

科学发掘 浏览 320 09-20

豪赚200亿,河南矿王,迎接泼天富贵!

飞鲸投研 浏览 190 01-29

女子带榴莲机场过安检被拦 2人狂炫3榴莲喊路人帮忙

闪电新闻 浏览 7753 06-22

五哈全员为宝石老舅送祝福

小海娱计 浏览 2165 07-22

P图只用一句话,小米超级小爱AI大模型“随心修图”上线

IT之家 浏览 224 11-17

英媒:英超可半场采访、进场摄像、拍更衣室,球队可拒绝第三项

直播吧 浏览 2017 07-30

42岁刘翔近况曝光

姩姩有娱 浏览 268 11-11

iPhone 17 Pro首拆:更大相机传感器、更易维修设计

IT之家 浏览 323 09-20

大六座SUV/售23.99万起 深蓝S09将于5月22日交付

网易汽车 浏览 426 05-13

今年秋天穿小香风外套,配阔腿裤太好看了!

LinkFashion 浏览 226 10-15

王传君评论区沦陷!拿奖感谢白百何惹争议,被质疑内涵对方没有奖

萌神木木 浏览 233 11-06

康恩贝:总裁退休前推行激励计划 销售费用八年超200亿元服务商现同名人员

金证研 浏览 1799 07-16

增收不增利!丰田汽车2024财年财报公布

敖博管理 浏览 405 05-13

莫斯科保卫战要打响 战斧导弹将抵乌:普京彻底坐不住了

文雅笔墨 浏览 357 10-01

34岁数学教授王虹受热捧 老家村民:她从小就很聪明

极目新闻 浏览 9675 06-22

李想汽车研究院:让AI从"工具使用者"进化为"工具创造者"

科技行者 浏览 177 02-05

两种外观套件选择 一汽奥迪A5 L申报图曝光

网易汽车 浏览 5160 06-24

不近视体质真的存在吗?

身体密码破译局 浏览 5243 06-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11