关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者2025-11-11 00:00:0140人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

微软旗舰 Win11 笔记本 Surface Laptop 8 曝光

IT之家 浏览 4844 08-06

「晨习」习近平总书记强调的“人民城市”

趣看热点 浏览 8249 07-15

暑假档电影口碑出炉!《长安的荔枝》无聊,《南京照相馆》封神

娱乐圈笔娱君 浏览 4545 07-24

卷上天的新能源厂商,销量却被燃油车背刺了

虎嗅APP 浏览 119 10-14

多国暂时停止向美国寄送包裹:受美国关税政策影响

每日经济新闻 浏览 300 08-25

债基短期大跌,专家支招避险 →

国际金融报 浏览 264 08-22

香港住宅史最大亏损纪录:9年前买入 已亏13亿港元

每日经济新闻 浏览 301 08-22

消息称某厂工程机搭50MP三摄及雾面工艺,或为小米REDMI K90系列

IT之家 浏览 297 08-11

历史性突破:中国战队提前锁定“机器人足球世界杯”冠亚军

IT之家 浏览 10324 07-21

歌手杨丞琳发文报平安,称刚完成一场不小的手术

烟云过眼 浏览 222 09-01

记者:克雷桑头部被踢了一下,换下他是用了脑震荡条款

直播吧 浏览 145 09-21

中国AI芯片维修需求激增,有商家月修500块英伟达高端GPU

网易科技报道 浏览 8705 07-25

为什么骑手的保障,“普惠”更重要?

财经无忌 浏览 73 10-31

尤文旧将阿莫鲁索:不能让伊尔迪兹独自承担赢球责任

懂球帝 浏览 135 09-29

GPT-5来了,Kimi却掉队了

阿尔法工场 浏览 7258 08-12

《西游记》「如来佛祖」北京病逝 六小龄童悼念!

ETtoday星光云 浏览 3625 08-04

李想老友创业7年,拒绝孙正义控股,要做商用车里的特斯拉

中国企业家杂志 浏览 275 08-19

河床官方:阿根廷国脚后卫佩泽拉ACL断裂:据悉将伤缺7-8个月

懂球帝 浏览 292 08-11

莱万:哈维深爱着巴萨,因为他的贡献俱乐部才有了今天

懂球帝 浏览 670 08-14

上证指数创四年新高了!

菜鸟理财 浏览 5881 08-14

今年最强阵容的大片,杀疯了

独立鱼 浏览 32 11-25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11