关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro2026-02-02 12:00:01261人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

今年电动汽车销量将创六年来最慢增速

大象新闻 浏览 298 01-06

第十三届互联网安全大会开幕:All In Agent

新熵 浏览 2849 08-06

大金晒出对话录屏!许凯承认动手家暴

萌神木木 浏览 511 08-23

哈梅内伊最新警告:若再次遭袭 伊朗将予以更猛烈反击

环球网资讯 浏览 5051 07-17

曝巴萨买断拉什福德计划,暂不与曼联谈判!经纪人联系大巴黎施压

罗米的曼联博客 浏览 422 09-26

一名美国士兵因涉嫌对华出售机密被控为间谍 中方回应

外交部网站 浏览 614 08-23

得物与小红书,互相抄作业

零态 浏览 2946 07-21

美的集团与华为签署战略合作协议

证券时报 浏览 390 09-21

直升机从密云救走的孕妇母女平安 闺女起名叫“想想”

新京报 浏览 10236 08-06

中信证券、华夏基金,大动作!

券商中国 浏览 6774 07-24

国庆"被弃高速"的小狗主人找来了 主人:不是故意丢弃

红星新闻 浏览 471 10-09

马年“春晚”排成这样,我断言:观众看完,会站起来鼓掌

皮皮电影 浏览 304 01-13

云业务继续狂飙!甲骨文与Meta洽谈200亿美元AI云计算协议

华尔街见闻官方 浏览 422 09-20

告别臃肿!这种简约的高级穿法,别拒绝

Yuki女人故事 浏览 260 01-23

大S逝世一周年!S妈现身雕像揭幕,生前最后时光曝光,自曝没遗憾

萌神木木 浏览 246 02-03

预算10万左右想买车,建议选这三款

鸭梨说车 浏览 512 05-10

美政府"关门"将结束 民主党8人倒戈加入共和党人行列

红星新闻 浏览 310 11-12

本田宣布将终止与通用汽车合资公司的燃料电池生产

IT之家 浏览 288 01-21

别再揪着不放!孙杨张豆豆就和麦琳李行亮一样,一个愿打一个愿挨

娱乐圈笔娱君 浏览 111 05-09

重庆一养殖户捅刺杀害供电所所长 已被执行死刑

澎湃新闻 浏览 420 09-19

美记:杨瀚森团队知道其不是球队的首选 球员的未来尚不稳固

直播吧 浏览 896 08-07
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11