关闭广告

ACL 2025:DeepSeek与北大团队获最佳论文

网易科技报道2025-07-31 12:00:012373人阅读

2025年7月27日至8月1日,第63届 (计算语言学年会)在奥地利维也纳举行。今年大会总投稿量突破8000篇,创历史新高,最终主会接收率为20.3%,Findings 接收率为16.7%。根据大会官方数据,中国作者首次在第一作者占比中过半,达到51.3%,远超第二名美国(14.0%)。

本届 ACL 共评选出4篇最佳论文。 与北耀东团队各摘得一项,另两项授予 CISPA&TCS Research&微软团队,以及斯坦福大学与 Cornell Tech 合作团队。

其中《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》由DeepSeek 团队与北京大学、华盛顿大学合作,梁文锋亲自挂名,论文提出稀疏注意力机制 NSA(Native Sparse Attention),显著提升长上下文训练与推理效率。该模型通过引入多路径注意力与硬件对齐优化,在保持精度的同时实现推理加速,验证了其在 A100 GPU 上的实际性能优越性。

北大团队则在论文《Language Models Resist Alignment: Evidence From Data Compression》中首次系统性提出“大模型抗拒对齐”机制,指出模型在微调阶段可能因预训练结构惯性发生“弹回”,挑战了现有对齐方法的有效性。论文由杨耀东团队主导,强调大模型安全与治理的深层风险,被大会主席评价为“为安全对齐问题提供坚实理论基础”。(袁宁)

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

BBC记者:曼城已经决定留下萨维尼奥,罗德里戈加盟通道彻底关闭

直播吧 浏览 9312 08-19

最美丽的法国电影,《泰坦尼克》也向它致敬!

幕味儿 浏览 16 08-21

小鹏汽车9月交付超4万台同比增长95% 推国庆限时补贴

网易汽车 浏览 18 10-02

苏州农商银行年薪122万女高管辞任,从柜员做起、在农信工作30年

湘财Plus 浏览 8307 07-28

美国驻以色列大使狠批英国首相 外媒:猛烈程度罕见

参考消息 浏览 2265 08-10

《伟大的长征》首发预告,于和伟饰演毛泽东,总觉得差点意思

最爱酷影视 浏览 22 10-14

同意吗哈曼:拜仁问题在基米希磁卡而非中卫,拜仁中场没防守

直播吧 浏览 5213 07-30

多城土地调整规划再出让:增加居住用地占比

澎湃新闻 浏览 17 08-22

许凯赵晴聊天记录疑曝光,赵晴曾劈腿与许凯交往

小咪侃娱圈 浏览 18 08-24

俄罗斯客机坠毁!50年的老爷机致49人遇难,普京会买C919吗?

北向财经 浏览 6114 07-25

哪吒App断网/特斯拉推视觉方案/欧拉销量大跌

汽车圈大小事儿 浏览 4516 05-06

阿隆索:我们在安菲尔德跑动太少?不能凭一场比赛下结论

懂球帝 浏览 12 11-09

普京:调解乌克兰危机的基础是消除其成因

国际在线 浏览 6323 08-17

辽宁加时95-82江苏,赵继伟16+7+8,威尔斯21分

懂球帝 浏览 13 02-04

上证指数创四年新高了!

菜鸟理财 浏览 4093 08-14

地缘因素引爆大宗狂欢!机构上调金价目标至5000美元,白银飙涨近8%,铜价再创里程碑

第一财经资讯 浏览 7 01-06

两种容量、最高纯电续航超320公里,极氪8X电池信息揭晓

IT之家 浏览 13 01-19

特朗普与普京对话被唇语专家解读:想知道内幕信息吗

红星新闻 浏览 2096 08-16

欧盟同意无限期冻结俄央行在欧洲资产

大象新闻 浏览 13 12-13

被诅咒?记者:鹈鹕墨菲&琼斯&德章泰-穆雷&奎因 都在术后恢复期

直播吧 浏览 2847 07-19

抢占“金九银十”先机 车企纷纷在沪发布新车

看看新闻Knews 浏览 2701 08-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2