关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro2026-01-16 12:00:01173人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

AI时代,重做ERP

钛媒体APP 浏览 303 10-13

纵贯一整年的精彩:柏林电影节佳作在中国

幕味儿 浏览 196 12-19

女人年纪大了,千万别穿紧身裤和运动鞋,这样打扮更高级得体

静儿时尚达人 浏览 2112 07-31

夏天穿衣别太纠结,看看这些日常穿搭就有灵感,显瘦又显身材

静儿时尚达人 浏览 10270 06-26

又一民营银行换帅,前任曾领衔掼蛋俱乐部

财经众议院 浏览 7447 07-12

一架可与核潜艇通信的美军机在格陵兰岛附近"异常"飞行

环球网资讯 浏览 434 08-24

汽车行驶时都有哪些盲区?一起来看看

粤通卡 浏览 436 05-15

奖金1.5万元,破赛事新纪录,张水华拿下2026年第一个冠军

数字财经智库 浏览 194 01-02

环卫工翻垃圾找手表当事游客被传是法院干部 官方辟谣

纵览新闻 浏览 1427 07-15

经典落幕:苹果正式将初代iPhone SE列为过时产品

环球网资讯 浏览 187 12-02

饿了么原CEO韩鎏被警方带走调查

界面新闻 浏览 1228 06-21

翟欣欣被判12年!欺负老实人终将付出代价

梦史 浏览 372 09-20

估值与流动性双轮驱动 高盛维持A股H股增持评级

环球网资讯 浏览 335 09-20

何穗:新生亦重生

时尚COSMO 浏览 118 03-11

小S暂无复出计划,制作人B2曝其近状,两人私下聊天内容曝光

扒虾侃娱 浏览 3259 07-15

澎湃:球迷要明白看台不是法外之地;辱骂球员被行拘咎由自取

懂球帝 浏览 2625 07-21

「好想来」与鸣鸣很忙,谁都成不了蜜雪冰城

36氪财经 浏览 287 10-23

2025款岚图FREE+新车商品性评价

车质网 浏览 234 10-25

特朗普签了!铜关税50%,韩国15%,印度25%,巴西50%!纽约铜价暴跌20%

国际金融报 浏览 3270 07-31

夏天尽量少穿一身黑,试试印花裙和露肩上衣,高级又显气质

静儿时尚达人 浏览 3144 07-12

第二代秦PLUS加推三款新车 限时6.98W起 真国民家轿

小蚊子聊车v 浏览 260 09-30
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11