热点资讯

新智元报道

编辑：桃子好困

【新智元导读】ACL首届博士论文奖公布了，UC伯克利助理教授Sewon Min摘桂冠！开幕式上，组委会公开了今年参会背景，提交论文的中国作者占全世界一半。ACL，如今成了中国的顶会？

ACL 2025在维也纳开幕了！

今年的ACL，可谓是座无虚席，盛况空前。开幕式上，组委会公布了今年参会的具体情况。

值得一提的是，论文里的中国作者已经占据了半壁江山，比例超过51%。

其中，第一作者有高达51.3%来自大陆，排在第二的美国仅为14%。

ACL今年整体情况如下（主会议部分）：

• 1,700篇主会论文，1,400篇Findings论文，108篇产业论文

• 17篇CL（Computational Linguistics）论文，40篇TACL（Transactions of ACL）论文

• 2场主旨演讲，1场专家小组讨论

此外，顶会附属活动还包括：28场workshop（投稿超800篇），8场教程（tutorial），64演示（demo），104篇学生研究工作（SRW）论文。

同在今天，首届ACL「计算语言学博士论文奖」正式公布了。

来自UC伯克利EECS助理教授Sewon Min，因论文Rethinking Data Use in Large Language Models斩获大奖。

7月初，她曾获得了ACM博士论文奖荣誉提名

ACL成了中国顶会？

作为NLP领域A类顶会之一，ACL每年汇聚了世界各地学者，今年是第63届年会。

回看过去十年，ACL总论文提交量增长了10倍，过去5年增长了4倍。

今年，顶会共提交了8360（8350）篇论文，其中主会录用率为20.3%，共有1699篇论文。Findings录用率为16.7%，共有1392篇论文。

相较于去年，论文总提交数量上涨了70%，审稿人共有5903人，上涨了38%。

更有趣的是，ACL桌拒比率比24年飙升160%。

从提交论文研究的领域来看，NLP应用（13.1%）位列第一，资源和评估占比12.4%，还有多模态和语言Grounding、语言建模等领域，成为了研究重点。

其他一些数据统计：

67%的论文标题和摘要中有「LLM」一词，其中9%提及了GPT，8%提及了Llama，还有2%论文提及了DeepSeek、BERT、Gemini/Gemma。

50位作者提交了超过10篇论文，23%的作者提交了超2篇论文。

250篇论文有超10位作者，仅一位作者论文有20篇。

65%的论文标题里都有「:」！

目前，ACL最佳论文奖暂未公布，今年首次公布了「计算语言学博士论文奖」。

ACL首届博士论文奖

这篇获奖论文Rethinking Data Use in Large Language Models，于2024年发表，全文长达157页，是华盛顿大学Sewon Min的博士毕业论文。

ACL组委会点评，这篇论文为大模型的行为和能力提供了关键见解，特别是在上下文学习方面。

其研究结果，对当今NLP的核心产生了影响。

论文地址：https://www.sewonmin.com/assets/Sewon_Min_Thesis.pdf

总的来说，这篇研究核心，重点围绕LLM如何利用训练时使用的的大量文本语料库。

首先，作者揭示了这些模型在训练后学习新任务的内在机制——其所谓的上下文学习能力几乎完全取决于从训练数据中获取的知识。

接着，她又提出了一类新型非参数化语言模型。

它们将训练数据重新定位为可检索的信息数据库，从而显著提升准确性与可更新性。

在此过程中，作者还开发首批广泛应用的神经检索模型之一，以及将传统两阶段流程简化为单阶段的创新方法。

研究表明，非参数化模型为负责任的数据使用开辟了新途径。比如，通过对授权文本与受版权内容的分类差异化处理。

最后，Sewon Min对下一代语言模型的发展方向作出展望，强调高效Scaling、事实性增强、去中心化架构这三大核心目标。

7月初，她的这篇论文，还获得了ACM博士论文荣誉提名。在接受ACM采访中，她首次畅谈了选择LLM领域原因，以及对当前AI领域的一些看法。

以下内容，为采访部分截取：

Q：你是如何决定将LLM作为研究方向的？

NLP领域的研究者长期致力于构建「通用模型」——无需针对特定任务训练就能处理多种任务。

当大语言模型出现时，其技术路径是通过海量数据的自监督训练来构建巨型模型，从而消除对人类监督的依赖。

这似乎为实现该目标指明了一条道路。

这个理念简单得令人沮丧，却揭示了诸多关键要素：数据质量与规模的核心作用、对人类先验知识的最小化依赖、以及消除人工标注环节。以上是官方回答。

老实说，这个领域听起来就令人兴奋，而且研究过程充满乐趣。如今该领域能产生如此广泛而深远的影响，我感到非常幸运。

Q：你在近期演讲中提到，当前LLM生成人物传记时，事实错误率高达42%。为何会出现这种情况？

我认为这与当前LLM基于记忆训练数据的底层机制有关。

对于知名人士，模型能生成准确传记，因为相关高频出现于训练数据中；但对于曝光不足的对象，模型往往无法准确回忆，转而生成看似合理实则错误的文本（即幻觉现象）。

这反映了此类模型数据学习机制的核心局限。

Q：你在「非参数化」大语言模型领域取得突破性成果。能否举例说明非参数化大语言模型与标准大语言模型在生成响应时的区别？

标准大语言模型常虚构事实。例如，当我询问无法联网的ChatGPT「首尔有哪些米其林三星餐厅」时，它错误列举了二星餐厅Gaon和已歇业的La Yeon，甚至编造营业时间——这反映出记忆知识的过时与缺失。

而非参数化大语言模型会从实时更新的数据存储中检索文档（如2025年提到首尔唯一三星餐厅Mingles的文章），并基于这些文档给出正确答案。

作者介绍

Sewon Min是加州大学伯克利分校电子工程与计算机科学系的助理教授，同时也是艾伦人工智能研究所的研究科学家，并隶属于伯克利人工智能研究实验室和伯克利自然语言处理研究组。

她的研究方向是自然语言处理和机器学习，特别是在大语言模型领域——致力于深入理解并推动模型的发展，重点研究如何利用海量的文本语料库。

此前，她在华盛顿大学获得计算机科学与工程博士学位，在首尔大学获得计算机科学与工程学士学位。曾担任Meta FAIR的兼职访问研究员，并先后在谷歌研究院和Salesforce研究院实习。

参考资料：

https://x.com/aclmeeting/status/1949836573144445424 https://www.acm.org/articles/people-of-acm/2025/sewon-min

ACL首届博士论文奖揭晓！半个顶会都是中国人，超51%占比史无前例

吃水煮菜练出...

赵震：中国青...

兹维列夫脚踝...

意副总理喊马...

张靓颖发文怒...

女排世锦赛上...

刘强东又拿下理想，京东汽车靠谱吗？

俄方称乌克兰应是去军事化的中立国家

中年女人穿对了才显气质！不穿花不穿紧，舒适好看还高级

塞萨洛尼基大学推出MBC：让AI大脑像U盘一样随时扩容

特朗普：泽连斯基意图退出矿产协议乌永远无法加入北约

《歌手2025》终于不再体面，硬捧单依纯翻车

一年狂揽60亿融资！13大玩家厮杀无人配送，阿里京东美团都入局了

宗馥莉被3名自称同父异母弟妹起诉娃哈哈回应

马斯克Grok 4.2炒股收益率夺冠

卫星直连，曹操出行自动驾驶平台将实现厘米级高精定位

小白鞋输了！现在流行“仙女裙+运动鞋”，巨洋气巨显腿细！

“一把手”对调换防，成都本土2家国资银行“很炸裂”！

薛鹤翔：玻璃纯碱预期已至，供需缓修——能源化工专题

新能源销量半年报：折腾了半天，电车还是“杀不死”油车

崔东树：2025年全国汽车市场总体走势较强新能源商用车景气度走高

内饰配置再提升新款极氪X内饰官图发布

墨西哥总统宣布将向古巴提供援助并推动恢复石油供应

智元机器人邓泰华：2025年具身智能迎来商用拐点

蹭周星驰热度，靠美女吸眼球，既糟蹋了无厘头，也侮辱了东北喜剧

场均盖帽+抢断最少的DPOY：罗德曼包揽倒二斯玛特在列

16岁＂烤鸡少年＂承认用＂肉宝王＂曾因日销百只烤鸡爆红

燕京啤酒卖汽水，上半年饮料收入占比不足1%

公安机关将会同有关部门进一步加强“智能驾驶”规范管理

特朗普万万没想到自己最想要的东西被中国送欧洲国家