关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者2025-11-11 00:00:01301人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美军火商称俄乌冲突及巴以冲突推动利润增长

环球网资讯 浏览 328 10-22

业绩下滑逾三成!上纬新材复牌后又涨停,游资爆炒已成强弩之末?

21世纪经济报道 浏览 1382 08-06

哈弗猛龙燃油版售14.69万起 逆潮而涌的方盒子

网易汽车 浏览 521 05-28

央视披露解放军实战演练"斩首"行动画面

北京日报 浏览 264 01-17

50万往上的车,还用1.5T增程器,车企穷疯了?左右逃不出3个原因

小李车评李建红 浏览 269 01-08

特斯拉的“后发制人”:Model Y L和Model 3+能否扭转颓势?

极智动力 浏览 10409 07-30

"十四五"期间约有3.5亿人乘坐飞机出行

新华社 浏览 7350 07-22

10月龄婴儿展厅内喝奶被赶 上海动物园道歉

环球网 浏览 5666 07-02

分手26年 如今的邵美琪已是郑伊健高攀不起的存在

奥字侃剧 浏览 414 09-11

杨振宁逝世享年103岁 清华大学沉痛悼念

北京青年报 浏览 272 10-19

许凯被指长期聚众赌博一年金额高达百万 警方回应

大象新闻 浏览 476 09-09

踩雷地产陷亏损泥潭,横琴人寿高管持续洗牌

经理人杂志 浏览 10133 08-13

夫妻靠编藤椅把儿子培养成浙大硕士:手指纹都磨没了

都市快报橙柿互动 浏览 8246 07-21

全新奔驰GLC EV内饰官图来了,奔驰中最大屏幕,未来会国产!

汽车公告板 浏览 508 09-06

跑调风波越演越烈!沈佳润被网友喊话

萌神木木 浏览 261 01-02

小米辟谣“雷军通过富国银行茅XX向海外转出50亿美金”:从未合作和接触,已启动司法程序追责

澎湃新闻 浏览 5663 08-09

19.79万元起,新一代智己LS6正式上市

北京商报 浏览 424 09-11

【WAIC2025】AI教父杰弗里·辛顿:避免“养虎为患”,要训练“善良”的AI

经济观察报 浏览 2362 07-27

美国政府已持有英特尔10%的股份 特朗普:伟大的交易

财联社 浏览 563 08-24

罗晋婚变疑云再升级,任素汐也遭殃

可乐谈情感 浏览 180 12-21

时尚守艺人 | 这不是幻觉,麒麟真的眨了眼

时尚COSMO 浏览 394 10-22
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11