关闭广告

ACL 2025:DeepSeek与北大团队获最佳论文

网易科技报道2025-07-31 12:00:018749人阅读

2025年7月27日至8月1日,第63届 (计算语言学年会)在奥地利维也纳举行。今年大会总投稿量突破8000篇,创历史新高,最终主会接收率为20.3%,Findings 接收率为16.7%。根据大会官方数据,中国作者首次在第一作者占比中过半,达到51.3%,远超第二名美国(14.0%)。

本届 ACL 共评选出4篇最佳论文。 与北耀东团队各摘得一项,另两项授予 CISPA&TCS Research&微软团队,以及斯坦福大学与 Cornell Tech 合作团队。

其中《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》由DeepSeek 团队与北京大学、华盛顿大学合作,梁文锋亲自挂名,论文提出稀疏注意力机制 NSA(Native Sparse Attention),显著提升长上下文训练与推理效率。该模型通过引入多路径注意力与硬件对齐优化,在保持精度的同时实现推理加速,验证了其在 A100 GPU 上的实际性能优

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

游客在大理"跳火把"面部被烧伤 有人往火里撒松香助燃

封面新闻 浏览 8395 07-23

机器狗浇花、机器人越野:这比赛比综艺还好看

36氪 浏览 7 12-11

中产阶层撑起了大行科工

斑马消费 浏览 4913 07-28

媒体:特朗普磨刀霍霍 欧盟将向美开放20万亿美元市场

新民晚报 浏览 6440 07-29

队报:巴黎相信舍瓦利耶能接班,考虑续约成本愿意卖多纳鲁马

懂球帝 浏览 9428 07-29

稳定币2028年市场规模达2万亿美元?摩根大通泼“冷水”

环球网资讯 浏览 6284 07-25

受益于“雅下”水电工程 基建行业有望迎来增长新空间

金证研 浏览 9705 07-26

夸克健康大模型通过12门主任医师考试,已落地夸克深度搜索

电厂 浏览 1194 07-24

俄乌冲突以来首次 乌克兰多地爆发大规模反政府抗议

红星新闻 浏览 9182 07-24

孙颖莎:目前身体状态不错,接下来是实力的对抗比拼,一场场准备

直播吧 浏览 260 08-21

登上全球第一,阳光电源,开挂了!

飞鲸投研 浏览 913 07-12

世锦赛男子200米蝶泳预赛:陈俊儿第四晋级半决赛,徐放遭遇淘汰

直播吧 浏览 7478 07-29

篮网的痛!蒂格谈21年半决赛G7:我亲身经历过最好的一场比赛

直播吧 浏览 7440 08-10

德米纳尔救赛点夺第十冠,90后冠军数排行榜上能列第几?

网球之家 浏览 2909 07-30

Google发布Genie 3!3D世界模型或成巨头逐鹿新战场?

雷科技 浏览 6461 08-07

逆势而上:一家基金会的七年“草根”试验与公募转型挑战

华夏时报 浏览 159 09-26

突发!56岁博导董事长被留置,此前董秘已被立案

深蓝财经 浏览 2868 07-24

丰田该对特朗普说谢谢

虎嗅APP 浏览 1737 07-26

下一代丰田GR卡罗拉或搭全新2.0T四缸发动机

车质网 浏览 43 11-11

日本34家污水处理厂污泥中检出有机氟化合物

浏览 75 11-17

牛市“中场休息”?机构激辩A股后市:“牛回头”行情不改牛市本色

华夏时报 浏览 183 09-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11