关闭广告

ACL 2025:DeepSeek与北大团队获最佳论文

网易科技报道2025-07-31 12:00:018388人阅读

2025年7月27日至8月1日,第63届 (计算语言学年会)在奥地利维也纳举行。今年大会总投稿量突破8000篇,创历史新高,最终主会接收率为20.3%,Findings 接收率为16.7%。根据大会官方数据,中国作者首次在第一作者占比中过半,达到51.3%,远超第二名美国(14.0%)。

本届 ACL 共评选出4篇最佳论文。 与北耀东团队各摘得一项,另两项授予 CISPA&TCS Research&微软团队,以及斯坦福大学与 Cornell Tech 合作团队。

其中《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》由DeepSeek 团队与北京大学、华盛顿大学合作,梁文锋亲自挂名,论文提出稀疏注意力机制 NSA(Native Sparse Attention),显著提升长上下文训练与推理效率。该模型通过引入多路径注意力与硬件对齐优化,在保持精度的同时实现推理加速,验证了其在 A100 GPU 上的实际性能优

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

马竞主席:阿尔马达是巨大补强,希望他像诸多同胞一样书写辉煌

直播吧 浏览 2296 07-30

释永信的AB面:从花和尚到商业天才,现代商业催生佛门怪胎?

北向财经 浏览 4217 07-28

桂林16.5亿烂尾项目被通报 时任官员挪6500万强行上马

中国能源网 浏览 4679 07-15

天津蓟州遭遇山洪:水10分钟灌满屋 不到1小时村庄被漫

极目新闻 浏览 4465 07-30

缅北白家建设41个大型赌诈园区 致6名中国公民死亡

央视新闻客户端 浏览 4367 07-12

外媒披露:菲律宾想触碰中国的红线

环球时报国际 浏览 4752 07-16

传英伟达“挑战者”Groq接近完成新一轮融资,估值或翻倍至60亿美元

智通财经 浏览 5022 07-31

清华医工平台提出大模型「全周期」医学能力评测框架MultiCogEval

机器之心Pro 浏览 7892 07-23

"老虎"韩松落马半个月后 西安市委原常委康军官宣被查

政知新媒体 浏览 6387 07-30

布翁焦尔诺谈备战:新援融入顺利,将全力捍卫意甲冠军荣誉

懂球帝 浏览 3727 07-25

中国联通 eSIM 手机商用试验阶段开通页面提前上线,功能暂未实装

IT之家 浏览 933 07-13

WAIC前线|王昊:智联招聘AI版上线,不仅仅是一个Agent

网易科技报道 浏览 5768 07-28

华为全新鸿蒙有礼活动开启,含最高 100 元随机现金红包等

IT之家 浏览 4837 07-28

绿媒:大罢免彻底失败 似乎向大陆释放了一个信息

经济观察报 浏览 6169 07-29

赵薇母女现身机场,15岁小四月身高近170

疯说时尚 浏览 3692 07-27

东亚杯-中国女足4-2中国台北 邵子钦2球王妍雯世界波

网易体育 浏览 4638 07-14

扣押搜查24处军事场所 尹锡悦涉嫌外患罪被调查

财联社 浏览 1142 07-15

日本30年期国债拍卖结果出炉 投标倍数为23年以来新低

财联社 浏览 5743 06-06

乌方将向美国出售无人机 俄新型战略核潜艇入役

每日经济新闻 浏览 8752 07-28

特朗普让可口可乐改配方 可口可乐公司回应

环球网资讯 浏览 3386 07-17

伊姐周六热推:电视剧《长安的荔枝》;电视剧《临江仙》......

伊周潮流 浏览 9738 06-08
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11