关闭广告

ACL 2025:DeepSeek与北大团队获最佳论文

网易科技报道2025-07-31 12:00:018920人阅读

2025年7月27日至8月1日,第63届 (计算语言学年会)在奥地利维也纳举行。今年大会总投稿量突破8000篇,创历史新高,最终主会接收率为20.3%,Findings 接收率为16.7%。根据大会官方数据,中国作者首次在第一作者占比中过半,达到51.3%,远超第二名美国(14.0%)。

本届 ACL 共评选出4篇最佳论文。 与北耀东团队各摘得一项,另两项授予 CISPA&TCS Research&微软团队,以及斯坦福大学与 Cornell Tech 合作团队。

其中《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》由DeepSeek 团队与北京大学、华盛顿大学合作,梁文锋亲自挂名,论文提出稀疏注意力机制 NSA(Native Sparse Attention),显著提升长上下文训练与推理效率。该模型通过引入多路径注意力与硬件对齐优化,在保持精度的同时实现推理加速,验证了其在 A100 GPU 上的实际性能优

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

《小城大事》上星央八 热血筑梦正当时

小小李娱 浏览 197 01-05

马蜂窝AI路书全面开放,新功能直击出境游痛点

上观新闻 浏览 9864 07-13

女子丢下爱猫失联多日 警方在屋内洗衣机下发现一滴血

看看新闻Knews 浏览 9042 08-09

新片预售票房仅10万!被“打回原形”的黄晓明,午夜梦回可曾后悔

娱乐圈笔娱君 浏览 263 10-23

德国汽车产业陷入危机:劳动力一年流失 7%,对美出口下滑

IT之家 浏览 391 09-02

震惊!小米YU7、尊界S800保险费曝光

电动知家 浏览 9674 07-22

WAIC 2025|摩尔线程全功能GPU为美好世界加速

爱集微 浏览 10115 07-22

软件服务故障致“星链”网络中断2.5小时

环球网资讯 浏览 7704 07-25

男子如厕突发不适后去世 从倒地到失去意识仅1分钟

上观新闻 浏览 158 02-02

辛芷蕾:角色执笔

时尚COSMO 浏览 5520 07-26

中国拖拉机之王,要 IPO 了

投资家 浏览 9125 08-09

2026年世界互联网大会亚太峰会下月在香港召开

财闻 浏览 113 03-17

给未来AI的时间胶囊|姚卯青:未来两年把具身智能从实验室推向规模化商业

上观新闻 浏览 3034 07-25

张译李光洁喝酒聚餐,两人吃小馆被赞朴素接地气

喵姐爱娱乐8 浏览 4492 08-04

高端技术现“亲民化”浪潮:800V与激光雷达涌入15万级战场|汽车观察

封面新闻 浏览 9485 07-13

Windsurf交易内幕疯传:24亿美元被瓜分,背刺数百员工?

机器之心Pro 浏览 1630 07-15

三年巨亏30亿,鹏华基金闫思倩的“光环”与持有人的“叹息”

一地基毛 浏览 218 11-11

许凯脱饭粉丝爆料!前女友转发硬刚:烂黄瓜

萌神木木 浏览 411 08-25

黎巴嫩真主党领导人:将继续抵抗以色列的侵略

环球网资讯 浏览 1414 07-08

消息称苹果计划2026年底进军智能眼镜市场,重塑全球AR光学供应链

IT之家 浏览 155 02-03

60+女人,秋天穿衣“上紧下宽”,不紧绷、不暴露,优雅年轻

静儿时尚达人 浏览 287 10-16
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11