关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro2026-02-02 12:00:01164人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

一年关店3.9万家!老板套现、股东跑路…又一个暴利行业开始崩塌

深蓝财经 浏览 405 08-23

伊姐周日热推:电视剧《太平年》;电视剧《暗恋者的救赎》......

伊周潮流 浏览 167 01-26

易三方/云辇-A/2.0T 腾势N8L售29.98万元起

网易汽车 浏览 247 10-30

D-Link 友讯推出 BE9500 / BE7200+5G 无线路由器,优美流线设计

IT之家 浏览 1882 08-09

突发!万科郁亮辞任

财通社 浏览 198 01-09

致敬!1945不是空车而是满载英烈

央视新闻 浏览 250 09-04

日本开始一项"史无前例"行动:派多架战斗机前往欧洲

枢密院十号 浏览 366 09-20

外媒:扎克伯格态度转变 Meta使用阿里千问优化其最新AI模型

环球网资讯 浏览 202 12-11

郭宇欣刘萧旭太原盛典现场互动 太甜了

生性洒脱 浏览 192 11-27

曼联开局:5轮7分负曼城+阿森纳但胜切尔西,联赛杯爆冷出局

直播吧 浏览 321 09-21

索尼 PS6 游戏主机曝料:24GB 内存,Zen 6 CPU + RDNA 5 GPU

IT之家 浏览 6783 07-25

宋丹丹“没白活”家庭地位尽显 儿媳也百般讨好

章眽八卦 浏览 401 08-23

AR-HUD+800V 全新零跑C11售14.98万起

网易汽车 浏览 2597 07-12

半年度百强量化私募榜揭晓!稳博、阿巴马等领衔百亿!

私募排排网 浏览 8404 07-30

突击队“对冲”无人机 俄乌激战红军城

上观新闻 浏览 1533 08-13

美国7月ADP就业人数增加10.4万人超预期

网易财经 浏览 7973 07-31

高盛都要收购哈根达斯了?高盛大动作意欲何为?

江瀚视野 浏览 9559 08-12

长城汽车与贾跃亭重磅合作!

电动知家 浏览 9220 07-24

快手“沦陷”之夜:1.7万僵尸账号

影像温度 浏览 161 12-24

巴萨官方:巴勃罗-托雷获准未参加季前体检,在等待确定未来

懂球帝 浏览 7407 07-14

阿里云计算如何让大语言模型吃得更聪明

科技行者 浏览 184 01-23
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11