关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者2025-11-11 00:00:01221人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美军被指拟采购33辆车作为测试靶车 包括Cybertruck

环球网资讯 浏览 4029 08-10

英法德启动“快速恢复制裁”机制,伊朗谴责

环球网资讯 浏览 314 08-30

浙江稠州商业银行“共享法庭”实践,获评消费者权益保护领航企业

Daily每日财报 浏览 192 01-05

1-8月酒饮料茶行业利润增速19.9%,白酒行业迎来困境反转了吗?

郭施亮 浏览 299 09-29

纳指创历史新高稀土概念股普涨 中概股多数上涨

每日经济新闻 浏览 4642 07-15

努诺-门德斯:每个人都是团队的一部分,这是我们关键所在

懂球帝 浏览 3377 07-13

一塌再塌!36岁檀健次与大二女生谈恋爱,他的高跟鞋就是锤

严肃八卦 浏览 182 01-08

一度吞隐形蛋!吴易昺遭逆转一轮游,无缘锁定美网资格赛资格

全景体育V 浏览 1619 07-16

伊姐元旦热推:电视剧《人之初》;电视剧《轻年》......

伊周潮流 浏览 174 01-03

39岁生日当天佩通坦出庭 法院将判定其是否被正式解职

极目新闻 浏览 519 08-22

千亿市场!iPhone17推动eSIM全面落地

诗与星空 浏览 372 09-11

蒂格:威少让人们觉得拿三双很容易 而我连一次都没拿过

直播吧 浏览 399 08-23

特朗普批普京“在玩火”

浏览 10802 07-21

儿女都是债,58岁茹萍风光背后也难逃辛酸!

安山客 浏览 1859 07-18

浙江团队成功研发全球首款"骨胶水":粉碎骨头一粘就好

极目新闻 浏览 446 09-10

从胶体物理到创新药,南科大团队提出大分子药物稳定新理论

DeepTech深科技 浏览 179 01-19

冯德莱恩:若未与美达成协议 只有莫斯科和北京会欢呼

澎湃新闻 浏览 453 08-26

三万一辆的剁椒鱼头,成了不买房的年轻人的新家

快刀财经 浏览 358 09-10

两部门:深入推进农村产权流转交易规范化试点 推动农村产权流转交易和融资服务平台建设应用

农业农村部网站 浏览 5995 07-30

京东宣布全职骑手破15万人,投入20亿发福利,90天跑够3000单返购车款

红星新闻 浏览 4357 07-16

刘浩存的天终于亮了,张艺谋当初真的没有骗我们

小先生笔记 浏览 393 09-29
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11