关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者2025-11-11 00:00:01299人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

破云! 中国无人机三闯生死线

看看新闻Knews 浏览 7596 07-12

郑晓龙没说错,肖战早已走上男演员的另一条大道

趣文说娱 浏览 419 08-21

上海辅助生殖进医保后:门诊咨询量增加

澎湃新闻 浏览 9528 06-03

“反内卷”推进 光伏板块机会在哪里?

证券市场周刊 浏览 5027 07-16

中俄蒙三国互动频繁:俄罗斯向东转步伐加快

浏览 6124 07-14

差20亿,这个夏天还有戏?

时尚COSMO 浏览 4006 08-01

成本仅1500万,一定档就是冠军,我断言:安志杰这片是暑期档黑马

靠谱电影君 浏览 5247 07-09

在迪士尼私联“内胆”,图啥啊?

时尚COSMO 浏览 10299 07-09

赫尔松州政府大楼被导弹击中 乌方公布遭袭瞬间视频

国际在线 浏览 8003 06-07

定位20万级!奔驰大G尺寸,iCAR V27谍照曝光

新车评网 浏览 519 05-20

国常会重磅部署!

数据宝 浏览 329 10-18

特朗普语出惊人 称"要让药价降低1500%"

环球网资讯 浏览 3455 07-25

柬埔寨"太子集团"资产又遭冻结 豪车公寓总值超35亿元

红星新闻 浏览 311 11-06

美乌柏林两日会谈后 特朗普、泽连斯基同日发声

环球时报国际 浏览 327 12-16

痔疮药太宁栓“伤透”人们的心

网易健康 浏览 2933 06-03

带13岁甜馨看侃爷演唱会,李小璐被指传递夜店观

八斗小先生 浏览 6821 07-14

珠江啤酒高层变动,“华南王”何去何从?

国际金融报 浏览 3930 07-30

采用方盒子造型 方程豹钛7预告图发布

车质网 浏览 503 06-10

全新一代G87 M2 CS正式发布,新车将引进国内销售!

Sky车志 浏览 545 05-28

消息称 LG 启动混合键合机开发,追逐未来 HBM 内存制造关键技术

IT之家 浏览 5812 07-14

拐点来临!苏宁易购“大店战略”三年成效显现

时代周报 浏览 458 09-01
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11