关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro2026-01-16 12:00:01280人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

300353,重大资产重组!明日复牌

中国基金报 浏览 342 11-03

李凤刚出任北京现代总经理,20 年来首次由中国本土人才代表韩方

IT之家 浏览 308 11-10

葡萄牙足协官方:将在8月8日至11日举行的所有赛事中对科斯塔默哀

懂球帝 浏览 5658 08-06

航拍画面披露:日本被指昼夜赶建军事基地

环球网资讯 浏览 243 12-04

阿卡小遇波折三盘晋级,战袍意外陷争议:像根大葱还是致敬费德勒

网球之家 浏览 305 01-19

小个子秋季穿搭指南!7件单品穿出大长腿,显高10cm

Yuki女人故事 浏览 313 09-17

星河启智科学智能开放平台即将上线

观察者网 浏览 5592 07-24

罗萨里奥中央小将遭遇车祸,迪马利亚等队友帮助他脱困

直播吧 浏览 475 08-23

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者 浏览 258 01-28

不只具身智能和AI,2026年的热门风口有哪些?

BT财经 浏览 237 03-03

媒体:野田佳彦看到机会要对高市下手 高市有可能下台

新民周刊 浏览 288 01-18

叙政权宣布苏韦达冲突"已停止" 鲁比奥呼吁"停止屠杀"

澎湃新闻 浏览 10352 07-21

杜若溪一家海外度假,老公和女儿一起出镜

小小一米月儿 浏览 278 12-29

欧锦赛:东契奇26+10+11终获首胜 斯洛文尼亚大胜比利时

醉卧浮生 浏览 520 09-01

埃安N60上市10.68万起 标配激光雷达/零重力座椅

网易汽车 浏览 145 04-29

近期一些地方仍然出现校园食品安全问题 教育部回应

极目新闻 浏览 423 09-24

董璇失去的口碑,竟然被自己9岁的女儿挽回了

温读史 浏览 1564 07-22

暑假档电影混战开始了!四部新片调档,陈佩斯输给大鹏抢不到排片

萌神木木 浏览 4325 07-16

莫斯科空域遭侵袭 多位中国游客滞留

极目新闻 浏览 249 02-24

优衣库在华跑偏

北京商报 浏览 355 10-13

刘芳菲坐不住了 发帖疑回应与释永信传闻"仅是采访"

火山诗话 浏览 4079 07-31
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11