关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者2025-11-11 00:00:0139人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

迈阿密国际1-4不敌奥兰多城,马斯切拉诺:我负全部责任

懂球帝 浏览 303 08-11

蔚来年底盈利:超越短期目标,重塑自己的竞争力

百姓评车 浏览 89 10-21

上海机场可暂存充电宝7天 网友:存取不便 要走3公里

新京报 浏览 2890 07-03

程进被直红罚下,浙江队决定对此判罚提出申诉

懂球帝 浏览 7645 08-11

欧锦赛头号夺冠热门!塞尔维亚主帅:这不是约基奇和博格丹的球队

罗说NBA 浏览 336 08-19

离婚后的孙怡,住80平小屋,吃饭靠点外卖

萱小蕾o 浏览 272 08-17

欧盟"硬刚"美国底气不足 专家:没有勇气走向关系决裂

21世纪经济报道 浏览 2306 07-15

她也没做错什么吧,被骂成这样?

橘子娱乐 浏览 149 10-02

向太和向佐回应“向家破产”传闻

韩小娱 浏览 147 09-29

泰国准备就边境冲突起诉柬埔寨领导人 洪森回击

环球网资讯 浏览 823 08-20

谢孟伟彻底“凉凉”,多平台账号被封,潘长江的含金量还在上升

扒虾侃娱 浏览 167 09-19

增加全新配色 2026款岚图梦想家官图发布

车质网 浏览 239 08-22

上纬新材股价大涨10.17% 30个交易日累计涨幅近1000%

网易财经 浏览 3684 07-28

日本船只非法进入我赤尾屿领海 中国海警驱离

界面新闻 浏览 3024 07-12

WAIC前线|夏立雪:无问芯穹提出加速抵达AGI的两条进路

网易科技报道 浏览 2627 07-29

无锡机场通报"外国人将打火机带入登机口":漏检属实

封面新闻 浏览 3967 07-23

注册制改革助力IPO业务稳定增长

证券市场周刊 浏览 178 09-10

AI倒逼人类思考:什么是深度的美

文汇报 浏览 233 08-21

对话出门问问李志飞:人类需要一个AI“影子”

经济观察报 浏览 208 09-11

美院硕士在母校附近摆摊卖包子火了 父母也来陪他创业

都市快报橙柿互动 浏览 63 11-01

媒体:赖清德遭遇"四面楚歌" 台民众看清了他的真面目

环球网资讯 浏览 190 09-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11