关闭广告

ACL 2025:DeepSeek与北大团队获最佳论文

网易科技报道2025-07-31 12:00:018921人阅读

2025年7月27日至8月1日,第63届 (计算语言学年会)在奥地利维也纳举行。今年大会总投稿量突破8000篇,创历史新高,最终主会接收率为20.3%,Findings 接收率为16.7%。根据大会官方数据,中国作者首次在第一作者占比中过半,达到51.3%,远超第二名美国(14.0%)。

本届 ACL 共评选出4篇最佳论文。 与北耀东团队各摘得一项,另两项授予 CISPA&TCS Research&微软团队,以及斯坦福大学与 Cornell Tech 合作团队。

其中《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》由DeepSeek 团队与北京大学、华盛顿大学合作,梁文锋亲自挂名,论文提出稀疏注意力机制 NSA(Native Sparse Attention),显著提升长上下文训练与推理效率。该模型通过引入多路径注意力与硬件对齐优化,在保持精度的同时实现推理加速,验证了其在 A100 GPU 上的实际性能优

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

家长网上质疑儿子校服存在质量问题被拘 当地启动追责

现代快报 浏览 10136 08-14

立秋消费热!淘宝闪购超30万家餐饮店迎成交破峰,饿了么骑手数量达去年3.5倍

红星资本局 浏览 483 08-12

北青:中国女足亚洲杯首战主裁来自泰国,已分析摸底孟加拉

懂球帝 浏览 134 03-03

异军突起!周四与特朗普会面顺利,贝莱德的里德尔竞选美联储主席呼声渐起

华尔街见闻官方 浏览 189 01-19

OrangePi 6 Plus 开发板公布:12 核 CPU,双 M.2 SSD 双 5GbE

IT之家 浏览 281 10-13

西贝降价,部分菜品降幅超20%!

红星资本局 浏览 315 10-02

伊朗媒体称遭袭核设施内无核材料

环球网资讯 浏览 872 06-23

深圳“果链女王”拟减持3600万股,公司市值超千亿,正冲刺A+H上市

红星资本局 浏览 192 01-18

视频:特朗普公布击沉"运毒潜艇"画面

新华国际 浏览 180 10-20

二季度全球GPU销量7470万块!NVIDIA揽下更多份额

快科技 浏览 397 09-01

谷歌闪电"截胡"OpenAI,挖走这家公司CEO

网易科技报道 浏览 9128 07-12

美克家居被曝欠薪、欠货款 公司称在多举措保障稳定

经济观察报 浏览 340 09-20

Labubu爆火、泡泡玛特业绩大增,市场为何不买账?|智氪

36氪财经 浏览 3758 07-29

官方:郑钦文退出WTA500华盛顿站,之后参加两项北美1000级赛事

直播吧 浏览 1541 07-17

消息人士:以军原计划在土耳其打击哈马斯高层

央视新闻客户端 浏览 337 09-12

霉霉宣布订婚 男方被指就像一个人形金毛犬走向霉霉

红星新闻 浏览 305 08-28

低成本、高锐度布局风口上的创新药

一地基毛 浏览 238 11-11

巴西东北部一小型飞机坠毁 飞行员死亡

北青网-北京青年报 浏览 264 09-16

稳步迭代,全面超越:vivo S50 Pro mini 评测:小直屏旗舰的进化标杆

快科技 浏览 185 12-29

被问"与美国是否在协调对华立场" 将访华欧盟外长回应

澎湃新闻 浏览 10077 07-23

佩斯科夫回应“俄乌新一轮谈判将讨论'领导人会晤'”

环球网资讯 浏览 3813 07-23
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11