关闭广告

ACL 2025:DeepSeek与北大团队获最佳论文

网易科技报道2025-07-31 12:00:012370人阅读

2025年7月27日至8月1日,第63届 (计算语言学年会)在奥地利维也纳举行。今年大会总投稿量突破8000篇,创历史新高,最终主会接收率为20.3%,Findings 接收率为16.7%。根据大会官方数据,中国作者首次在第一作者占比中过半,达到51.3%,远超第二名美国(14.0%)。

本届 ACL 共评选出4篇最佳论文。 与北耀东团队各摘得一项,另两项授予 CISPA&TCS Research&微软团队,以及斯坦福大学与 Cornell Tech 合作团队。

其中《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》由DeepSeek 团队与北京大学、华盛顿大学合作,梁文锋亲自挂名,论文提出稀疏注意力机制 NSA(Native Sparse Attention),显著提升长上下文训练与推理效率。该模型通过引入多路径注意力与硬件对齐优化,在保持精度的同时实现推理加速,验证了其在 A100 GPU 上的实际性能优越性。

北大团队则在论文《Language Models Resist Alignment: Evidence From Data Compression》中首次系统性提出“大模型抗拒对齐”机制,指出模型在微调阶段可能因预训练结构惯性发生“弹回”,挑战了现有对齐方法的有效性。论文由杨耀东团队主导,强调大模型安全与治理的深层风险,被大会主席评价为“为安全对齐问题提供坚实理论基础”。(袁宁)

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

加多宝和王老吉又打击起来了?持续不断的争斗真的有意义吗?

江瀚视野 浏览 14 10-18

特斯拉全球第900万辆电动车在上海超级工厂下线

特斯拉 浏览 11 12-31

特朗普:美国还将增加航空母舰数量

每日经济新闻 浏览 9 12-23

50万往上的车,还用1.5T增程器,车企穷疯了?左右逃不出3个原因

小李车评李建红 浏览 9 01-08

又一队!曝天津女篮或退出WCBA 上季0胜32负创历史最差

醉卧浮生 浏览 14 08-23

告别91岁时尚传奇:优雅不是为了被注意,而是为了被记住

LinkFashion 浏览 13 09-06

2万台军集结出动海马斯军演 不到24小时大陆反制来了

掌青说历史 浏览 8564 07-10

写45万网文爆料华熙生物财务造假?当事人:网站一直被攻击,已在考虑放证据的时间

红星资本局 浏览 4732 07-27

mini版LABUBU将发售,79元一个,抽隐藏款概率为1/168

红星资本局 浏览 15 08-23

春树导演制片人回应争议,否认靠卖惨打动白百何,短信内容曝光

扒虾侃娱 浏览 12 11-09

上市即变脸 管理层震荡 澜沧古茶中报继续亏损

Daily每日财报 浏览 4622 08-19

新长安现任全体董事、高管增持:每人不低于30万元

红星资本局 浏览 2411 08-12

图片报:多特有意鲍勃等球员,但英超球队越来越不愿意卖人给他们

直播吧 浏览 9834 07-22

剑桥大学团队揭秘:如何让计算机像管家一样聪明地分配工作

科技行者 浏览 6 02-04

民营航天新年首战告捷:星河动力谷神星一号海上成功发射四星入轨

澎湃新闻 浏览 6 01-16

《鹦鹉》:短剧时长,长剧厚度,电影质感!这才能称之为精品短剧

最爱酷影视 浏览 5713 07-24

1300亿代工巨头出手:华虹公司拟收购华力微控股权,12英寸产能整合提速

时代周报 浏览 6870 08-19

13.98万起!比亚迪海狮06要替宋PLUS“扛大旗”

国际金融报 浏览 1317 07-26

包括氢动力版本 宝马全新一代X5最新消息曝光

乐选爱车 浏览 16 09-28

与OPPO并肩、以半固态破局:全新MG4的冷静突围

网易汽车 浏览 17 08-24

迪亚曼蒂:在广州有卖鳄鱼肉和鳄鱼皮的,简直不可思议

懂球帝 浏览 14 09-29
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2