关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro2026-01-16 12:00:01275人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

杨洋传遇上缅北剧组 开机就离开剧组?

陌上桃花开的 浏览 246 02-24

1胜2平,本轮海港、成都、申花均获本赛季亚冠首分

懂球帝 浏览 378 10-02

卢拉表示不急于对美国采取报复措施 曾称先与中印通话

澎湃新闻 浏览 568 09-01

上海国资出手!300841,提前暴涨16%,今日复牌

中国基金报 浏览 4234 07-21

机器人“霸屏”!来世界人工智能大会围观未来

上观新闻 浏览 5138 07-28

弗里克:来巴萨后我变了,我也不希望孙子看到爷爷是这样的

懂球帝 浏览 374 10-21

郝蕾风波升级!被扒曾参演《狂野时代》闹掰,辛芷蕾发声打脸她

萌神木木 浏览 289 11-08

马卡:皇马将在3周内参加7场比赛,球员目前状态出色

懂球帝 浏览 448 09-11

卢拉称和特朗普见面像"一见钟情" 上个月刚大骂特朗普

极目新闻 浏览 146 05-09

黄宗泽疑似新恋情曝光,和美女去看权志龙演唱会

探源历史 浏览 6938 07-20

紫牛头条|小伙用激光把南京夫子庙扫描做成3D游戏 1:1还原精度到厘米,网友:可以赛博旅游了

扬子晚报 浏览 323 10-21

神舟二十号航天员圆满完成第四次出舱活动;特朗普批准华盛顿特区恢复死刑

上观新闻 浏览 324 09-26

林心如曝霍建华消费观

科学发掘 浏览 299 11-03

女孩在团播里擦边:主持人为吸票让主播用腿夹爆气球

新京报 浏览 1319 07-18

“货车侧撞+固定柱体夹击”连环碰撞你受得了吗?奥迪Q6L e-tron:小意思!

封面新闻 浏览 2420 07-16

或将搭载V8引擎 奥迪Q9将于2026年发布

车质网 浏览 269 01-05

杭州联合银行2025年中期业绩透视:资产近6000亿大关,增长模式面临转型考验

Daily每日财报 浏览 593 08-20

多地机票价格显著回落 错峰游受青睐

环球网资讯 浏览 8963 05-31

中信证券两保代被自律处罚!案涉北矿检测IPO

深蓝财经 浏览 1439 07-29

东京车站一日本老人倒地头破血流 中国医学硕士施救

极目新闻 浏览 6301 07-27

低价“银行直供房”激增,有房产价格低于市价25%

第一财经 浏览 300 11-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11