关闭广告

ACL 2025:DeepSeek与北大团队获最佳论文

网易科技报道2025-07-31 12:00:018923人阅读

2025年7月27日至8月1日,第63届 (计算语言学年会)在奥地利维也纳举行。今年大会总投稿量突破8000篇,创历史新高,最终主会接收率为20.3%,Findings 接收率为16.7%。根据大会官方数据,中国作者首次在第一作者占比中过半,达到51.3%,远超第二名美国(14.0%)。

本届 ACL 共评选出4篇最佳论文。 与北耀东团队各摘得一项,另两项授予 CISPA&TCS Research&微软团队,以及斯坦福大学与 Cornell Tech 合作团队。

其中《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》由DeepSeek 团队与北京大学、华盛顿大学合作,梁文锋亲自挂名,论文提出稀疏注意力机制 NSA(Native Sparse Attention),显著提升长上下文训练与推理效率。该模型通过引入多路径注意力与硬件对齐优化,在保持精度的同时实现推理加速,验证了其在 A100 GPU 上的实际性能优

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

伊朗总统车队因加注掺水汽油抛锚 佩泽希齐扬被迫打车

环球网资讯 浏览 3402 07-18

她是影帝陶金之女,一生都没原谅过父亲

动物奇奇怪怪 浏览 6144 08-03

无人机群飞行规划员 驾驭天空的“幕后军师”

央广网 浏览 235 08-31

中芯国际产能“拉满”,净利润同比降19%

21世纪经济报道 浏览 10136 08-09

世运会非奥项目“破圈” 小众运动激活体育新消费

中国商报 浏览 5985 08-10

印深夜回击美关税威胁 专家:莫迪和特朗普兄弟情完了

环球网资讯 浏览 7615 08-06

迪马:米兰在体检后放弃博尼法斯,将葡体前锋哈德尔作为首要目标

直播吧 浏览 401 08-25

长城汽车正式取消"大小周" 老员工泪目:盼了30年

大风新闻 浏览 209 01-07

新增通行效率优先/三速泊车模式 腾势N9 OTA全新升级

网易汽车 浏览 1004 07-03

中国小伙赴越南"赚快钱"失联 疑遭拐卖刺伤司机后被捕

封面新闻 浏览 257 11-25

就理想i8碰撞测试 相关三方发布联合声明

界面新闻 浏览 1502 08-07

中国联通:首次实现云原生核心部件 100% 国产化

IT之家 浏览 3528 07-21

亮相皇马一周年,姆巴佩社媒发文纪念

懂球帝 浏览 2608 07-17

媒体:泽连斯基的"听话"不情不愿 离开白宫后发了个帖

新民周刊 浏览 448 08-20

今年秋天,有这几件单品就够了

黎贝卡的异想世界 浏览 266 10-18

国企并购重组活跃度骤增 年内A股相关案例同比增长182%

商业观察杂志社 浏览 897 07-15

全球首搭地平线6P+HSD 奇瑞星纪元E05设计稿曝光

网易汽车 浏览 4462 07-16

万科的最后一张王牌:千万年薪美女董秘

诗与星空 浏览 785 07-11

KAIST团队突破视频生成瓶颈:让AI学会"自我反思"修正动作错误

科技行者 浏览 174 01-28

天空体育:格伊拒绝与水晶宫续约,皇马、巴萨和尤文均有意免签

直播吧 浏览 433 08-27

拆分动力电池子公司上市未果,欣旺达“举家”赴港屯粮

华夏时报 浏览 7414 08-09
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11