关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者2025-11-11 00:00:01223人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

弄堂大舞台,有梦你就来,机器人也会梦到“烟火气”吗?

文汇报 浏览 4890 07-26

或首发搭载华为超500线激光雷达 岚图泰山11月将上市

网易汽车 浏览 295 10-22

蔚来推迟闭店时间!

电动知家 浏览 351 09-12

好心载同事却出车祸遭索赔 法院:司机承担60%赔偿责任

极目新闻 浏览 260 10-23

2025内娱第一瓜:许凯遭“天降魔嫂”,于老头遇“一生之敌”?

仙女事件簿 浏览 390 08-23

国防部:中国不参与任何形式的军备竞赛

环球网资讯 浏览 343 09-26

“高德扫街榜” 背后的商业逻辑是什么?丨商业快评

封面新闻 浏览 369 09-10

王皓批评林诗栋的原因曝光!赛后采访,张本智和意外提到了樊振东

侃球熊弟 浏览 3852 07-14

王阳惨了!孙菲菲揭其双面人嘴脸

暮云晨记 浏览 1879 07-10

福建舰弹射甲板焕然一新 8万吨巨舰做好最后服役准备

空天力量 浏览 1409 07-18

创下5年来最大跌幅,养老金涨幅降至2%,未来会停涨吗?

数字财经智库 浏览 5436 07-13

比亚迪腾势 N8L 无伪装实车图曝光,定位为插电混动大型 SUV

IT之家 浏览 4379 07-14

机场航站楼有人坠落砸到保洁员 画面披露

极目新闻 浏览 460 08-22

德天空:不莱梅与利兹联后卫施密特达原则协议 俱乐部间在商讨细节

直播吧 浏览 2968 07-29

名古屋望与南京恢复交流 前市长曾称南京大屠杀不存在

新民周刊 浏览 3642 08-06

美国电动汽车遭遇“断崖式”下跌

电动知家 浏览 247 11-05

内塔尼亚胡召开记者会 公布以军最新行动计划

环球网资讯 浏览 557 08-11

夏天穿冰淇淋色裙子,凉快!

Yuki女人故事 浏览 6207 06-12

女明星混得好,玄学不能少

江湖人称艾掌门 浏览 202 01-18

牛弹琴:特朗普对风车宣战了 怒斥其是"本世纪的骗局"

北京日报客户端 浏览 552 08-21

媒体:内塔尼亚胡环顾世界 发现以色列只剩下一个朋友

上观新闻 浏览 425 09-17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11