关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro2026-01-16 12:00:01276人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

舒淇现身亲揭《女孩》没报金马奖原因

ETtoday星光云 浏览 293 10-28

单依纯回应争议,“常石磊很爱她”勾起网友好奇

探长影视解说 浏览 5032 07-23

两大金融央企纪检组长换帅,迎来省级纪委副书记

财经众议院 浏览 3632 07-17

杨立昆、李飞飞等提出空间超感知范式,用预测未来代替暴力记忆

DeepTech深科技 浏览 313 11-09

苹果尴尬!新一代CarPlay终于有车企要用了

科技美学 浏览 566 05-18

世体:皇马拒绝让女超杯在迈阿密举行,女足俱乐部都感到不满

懂球帝 浏览 388 10-16

宁德时代:钠新乘用车动力电池正在与客户推进开发、落地中

IT之家 浏览 352 10-26

知名"富二代"所创明星机器人公司突解散 研发阵容豪华

每日经济新闻 浏览 339 10-19

今日热点:王鹤润方向王玉雯道歉;正午阳光辟谣《琅琊榜3》阵容信息……

伊周潮流 浏览 215 03-14

这4种版型的牛仔裤,真的很好穿!

Yuki女人故事 浏览 334 08-30

熊园:10月新房和二手房销售均走弱

首席经济学家论坛 浏览 328 11-04

中国学生在曼谷失联两月 母亲:有人告知儿子"被卖了"

红星新闻 浏览 10717 07-25

【夏窗截止日】1.3亿镑伊萨克HWG!拉比奥特→米兰,杰克逊去哪?

直播吧 浏览 455 09-01

陈浩民夫妇滞留阿联酋,半夜发文怀念祖国

北纬的咖啡豆 浏览 233 03-03

80一晚的网吧包间,被年轻人睡成大床房

快刀财经 浏览 539 08-20

嫁给汪涵17年,细扒杨乐乐心酸现状,她的选择真的对吗?

不八卦会死星人 浏览 299 10-16

正部长级王受文有新职

扬子晚报 浏览 4966 07-27

马斯克SpaceX太空能源计划浮出水面,中国光伏产业或成关键一环

DeepTech深科技 浏览 273 02-05

东方航空原董事长刘绍勇接受审查调查

澎湃新闻 浏览 10040 06-28

十年前的百度,聚拢了硅谷最杰出的天才,每个都比姚顺雨耀眼……

字母榜 浏览 263 01-29

BBC两高管宣布辞职 特朗普:他们试图"介入总统选举"

红星新闻 浏览 332 11-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11