关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者2025-11-11 00:00:01219人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

拐点已至:慢慢生长的蔚来,开始结果了

网易汽车 浏览 319 09-24

北芯生命:核心产品与新技术竞争关系陷罗生门 自称“金标准”背后技术路径现疑云

金证研 浏览 413 08-29

小鹏汽车11月交付新车36,728台 1-11月累计交付391,937台

网易汽车 浏览 177 12-02

最新民调赖清德崩盘 美国一个举动让民进党坐不住了

掌青说历史 浏览 5150 08-13

续航里程达408km 全新日产Micra EV官图发布

车质网 浏览 415 05-23

卡马乔:穆里尼奥现在依然是顶级教练,他永远都是皇马人

直播吧 浏览 454 08-22

大鹏自曝《长安的荔枝》本想让李雪琴演杨贵妃

韩小娱 浏览 5054 07-24

卡萨诺:小因扎吉耍了国际米兰,他早就和沙特那边谈妥了高薪

直播吧 浏览 331 09-21

爱奇艺2025年Q2财报:收入66.3亿 运营利润5870万

网易科技报道 浏览 446 08-21

美报告:中美一旦冲突 中国"家门口"美国人员很难幸存

环球时报国际 浏览 10393 07-12

伊藤美诚4-2战胜桥本帆乃香,晋级四强对阵朱雨玲

懂球帝 浏览 5449 07-12

充电十分钟、续航2000公里!宁德时代宣布:2027年量产全固态电池

优视汽车 浏览 230 12-02

辛巴“第五次退网”,单日销售64亿的头部神话,不干了

电商在线 浏览 423 08-20

中航科工2025年上半年收入双位数增长

证券市场周刊 浏览 367 09-01

即将开源!华为发布AI推理黑科技,已在中国银联落地

钛媒体APP 浏览 460 08-13

以军攻势升级 加沙两天内超4万人流离失所

澎湃新闻 浏览 315 09-18

米哈游、腾讯民事诉讼案9 月 5 日开庭,腾讯回应

IT之家 浏览 391 09-02

看完《逐玉》我承认我还是喜欢长剧

时尚COSMO 浏览 111 03-15

FIFA女足冠军杯:武汉女足首战奥克兰联,再胜一场将战阿森纳

懂球帝 浏览 416 08-21

全新电动宝马 M3 内饰曝光 预计2027年发布

天天电动 浏览 8539 07-01

能把埃尔法打下神坛?智界V9申报图曝光 定价50万左右

网易汽车 浏览 186 01-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11