关闭广告

ACL 2025:DeepSeek与北大团队获最佳论文

网易科技报道2025-07-31 12:00:019004人阅读

2025年7月27日至8月1日,第63届 (计算语言学年会)在奥地利维也纳举行。今年大会总投稿量突破8000篇,创历史新高,最终主会接收率为20.3%,Findings 接收率为16.7%。根据大会官方数据,中国作者首次在第一作者占比中过半,达到51.3%,远超第二名美国(14.0%)。

本届 ACL 共评选出4篇最佳论文。 与北耀东团队各摘得一项,另两项授予 CISPA&TCS Research&微软团队,以及斯坦福大学与 Cornell Tech 合作团队。

其中《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》由DeepSeek 团队与北京大学、华盛顿大学合作,梁文锋亲自挂名,论文提出稀疏注意力机制 NSA(Native Sparse Attention),显著提升长上下文训练与推理效率。该模型通过引入多路径注意力与硬件对齐优化,在保持精度的同时实现推理加速,验证了其在 A100 GPU 上的实际性能优

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

菲戈和伊尔迪兹获2025地中海卓越奖,颁奖典礼于10月20日进行

懂球帝 浏览 394 10-17

亚马逊云科技推出Kiro:全新agentic IDE,专为AI Agent打造

网易科技报道 浏览 4628 07-16

CEO们不再为了流量吹牛,挺好的

汽车公社 浏览 273 11-25

苹果 iPhone 17 产线接近满产,郑州富士康近 20 万人两班倒赶工

IT之家 浏览 459 09-10

科学家发现拖网捕捞和气候变暖加剧海洋中汞释放风险

新华社 浏览 373 10-02

瑞银点评Palantir财报:公司“叙事无瑕疵”,上调目标价至165美元

华尔街见闻官方 浏览 7705 08-06

来到荣耀开始的地方,鏖战三盘,“中国莎娃”杀进八强

网球之家 浏览 9607 07-24

东方甄选线下店开业:不卖菜卖简餐,全标品

商业观察家 浏览 106 05-06

黄仁勋身家超过巴菲特

21世纪经济报道 浏览 8028 07-14

《农业无人机行业白皮书(2024/2025)》发布:全球保有量超50万架,累计减碳4258万吨

环球网资讯 浏览 510 08-24

每天干十几个小时,月赚五六千元,有人6万元盘下,几个月后2万多才脱手!曾经爆火的创业项目遭嫌弃

都市快报橙柿互动 浏览 276 01-15

钢铁洪流压境!11万俄军强攻乌东命门

浏览 3575 07-14

一架退役飞机的“重生记”

人民网 浏览 378 08-29

2026开年,就创造了10个“第一”,这国综后劲真大

娱乐圈笔娱君 浏览 270 01-08

新不如旧!这4件时髦“旧衣服”今年太火了

LinkFashion 浏览 255 01-25

海底捞小便案详情披露:俩17岁男生玩游戏 家长赔220万

潇湘晨报 浏览 306 12-23

泡泡玛特新品MOKOKO未发售却被挂二手平台:价格翻4倍

封面新闻 浏览 617 08-21

今年春天的裙子,裙摆越大越好看!

LinkFashion 浏览 233 02-15

7月LPR,不变

网易财经 浏览 3103 07-21

强势母亲装摄像头查岗?黄宗泽谈不婚:10任女友9个半被嫌弃

娱乐白名单 浏览 899 07-15

美丹佛机场飞机起火 乘客从充气滑梯逃离

新华社 浏览 7114 07-29
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11