关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者2025-11-11 00:00:01302人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

暗示下家?哈维-西蒙斯社媒关注了多名切尔西球员

懂球帝 浏览 9796 07-22

宗馥莉第二次请辞 娃哈哈员工:宗庆后可能也没想到

澎湃新闻 浏览 359 10-13

媒体:中国举行大阅兵 震碎了西方反华人士的"玻璃心"

澎湃新闻 浏览 574 09-09

西班牙青训球队开除4名U16球员,他们曾为泄愤持刀威胁对手

懂球帝 浏览 274 11-27

面向全国 AI机器科学家挑战赛启动

中安在线 浏览 553 08-12

乌克兰问题华盛顿会晤举行,国际油价将如何演绎

第一财经资讯 浏览 517 08-19

70岁任达华一头白发出演网大 打戏成全片亮点

最爱酷影视 浏览 7582 07-27

哈斯勒姆:科比不想和任何人做朋友 扶起对手不是曼巴精神

直播吧 浏览 555 08-21

2025美网中国军团整体签运佳 6+N出战单打正赛

体坛周报 浏览 551 08-23

秋季穿衣别太老气横秋,看看这27套造型,时尚舒适又显高

静儿时尚达人 浏览 327 11-02

今年为什么格外热?

国是直通车 浏览 7826 07-12

限时11.98万元起 东风日产奇骏·荣誉上市

网易汽车 浏览 10371 07-04

中国公民需谨慎前往日本 四大原因披露

环球网资讯 浏览 282 11-17

央视前知名主持人水均益宣布当姥爷 女儿曾是央视记者

鲁中晨报 浏览 6408 08-13

涨价带不动业绩,“黄酒双雄”上半年刹车,古越龙山净利润被会稽山反超

时代周报 浏览 502 09-01

大疆、影石刺向彼此腹地:智能影像市场硝烟再起

蓝鲸新闻 浏览 10191 07-29

印度“揭竿而起”:要与特朗普硬碰硬

浏览 2435 07-14

范志毅:U23国足半死不活的踢法世界最先进最科学 对手不会踢了

念洲 浏览 297 01-18

多国表示不参与霍尔木兹海峡护航 特朗普抱怨盟友

齐鲁壹点 浏览 261 03-17

指腹为婚?姜文女儿法国出嫁,面部浮肿一脸孕相

清游说娱 浏览 532 08-11

全球首个击落隐身战机的防空部队 如今用上了中国导弹

环球网资讯 浏览 6756 07-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11