关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro2026-01-16 12:00:01176人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

2024乳企利润大跳水,蒙牛伊利光明“顶不住”,小品牌直接“躺平”?

经理人杂志 浏览 455 08-19

500亿市值北京国企,选举首位女掌门人,去年人均薪酬20万

华美财经 浏览 414 08-12

轻松!孙颖莎/王曼昱3-0金娜英/柳韩娜,晋级瑞典大满贯女双决赛

直播吧 浏览 358 08-23

苹果供应链大动作:部分Mac Mini生产今年将从亚洲转移到美国

IT之家 浏览 141 02-24

2026年必追的四部谍战剧 陈道明、于和伟领衔主演

娱乐圈笔娱君 浏览 189 01-23

中国资产深夜大涨,腾讯狂飙7%,市值超7000亿美元

21世纪经济报道 浏览 7862 08-14

饥饿营销?英伟达H20被曝供应有限,且不打算重启生产

观察者网 浏览 10300 07-21

饿了么前CEO韩鎏等人受贿 涉案金额达4000余万

红星新闻 浏览 11475 07-26

以色列部长回应"虐待环保少女":很自豪

CCTV国际时讯 浏览 189 10-06

三伏天里排寒湿,不妨试试6款药膳茶饮

人民网 浏览 1131 08-05

中国汽车品牌出海,鸡蛋不能放在同一个篮子里!

百姓评车 浏览 468 05-26

情报显示以军内部有证据表明其可能构成战争罪

北青网-北京青年报 浏览 223 11-10

揭秘俄士兵向机器人部队投降背后:乌有数百个秘密工坊

红星新闻 浏览 2974 07-15

又一家车企新车遭泄密,这已经是年内第三起了!

百姓评车 浏览 1379 07-15

中日关系大突破?美国措手不及,东亚势力崛起

浏览 8655 07-14

卫报:帕奎塔希望本月离队,弗拉门戈愿意为他付4000万欧

懂球帝 浏览 196 01-13

英特尔酷睿 Ultra5 245HX PassMark 跑分超 i5-14500HX 约 30~40%

IT之家 浏览 1521 07-13

萨哈:C罗重新定义了边锋踢球的方式,这样的转变需要惊人智慧

直播吧 浏览 4552 07-27

1700亿龙头巨额定增并赴港IPO,股东高管却纷纷减持

尺度商业 浏览 9959 08-07

新能源购置税免征时代,正在结束

盖世汽车 浏览 242 10-25

胡梅尔斯:告别战一切都很完美,再多踢一会儿体能就要撑不住了

直播吧 浏览 501 08-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11