关闭广告

OpenAI被曝IMO金牌「造假」,陶哲轩怒揭内幕!

新智元2025-07-21 12:00:021744人阅读


新智元报道

编辑:桃子 好困

【新智元导读】OpenAI高调摘下数学金牌,竟是自嗨!组委会内部人士透露,OpenAI不仅未与IMO官方合作,甚至无视赛事规则,在闭幕派对未结束前抢先官宣。全网怒批其不尊重人类选手,炒作过头。

,最新大瓜又来了。

昨日,因内部审核流程,。


原来,事情并非那么简单。

一位IMO内部人士透露,实际上OpenAI并没有和组委会合作,拿下AI金牌不一定真实有效。

最关键的是,他们违背了IMO规定的「公布时间」规则。


为了避免AI公司们抢夺人类学生的风头,IMO评审团要求:在闭幕式结束一周后再公布结果。

然而,OpenAI却在闭幕Party还未结束前,就发布了结果。



对此,谷歌DeepMind负责人Thang Luong表态,「是的,IMO组委会有一份不对外公开的官方评分标准」。

若未依据该标准进行评估,任何奖牌声明均无效。

扣除1分后应为银牌,而非金牌。


这么说来,OpenAI声称拿下IMO金牌,只是自嗨?!

OpenAI真面目被戳穿

抢夺学生风头

就在昨天,菲尔兹奖得主陶哲轩在一口气连发三条评论,暗指的就是OpenAI。

他表示,「自己不会评论任何未预先公开测试方法的AI竞赛成绩报告。在缺乏受控测试环境的情况下,AI的数学能力难以准确评估」。


另外,IMO组委会一位成员Joseph Myers透露,OpenAI并非是IMO合作测试模型的AI公司之一。

而且,阳光海岸的91位协调员(Coordinator)也无人参与结果评估。


P6题协调员表示,「IMO评审团和协调员一致认为,OpenAI此举显得失礼且不妥当」。

根据IMO规定,借助AI模型参赛的公司,需要在7月28日之后公布结果。

一家专注于数学AI初创公司Harmonic官方发文,从侧面印证了这一规定存在的准确性。


最新回应引热议

OpenAI研究科学家,德扑之父Noam Brown下场回应,给出了两点证明:

首先,团队是在闭幕式「之后」公开结果。闭幕式有直播记录,这一点很容易核实。

其次,他确认了OpenAI并未与IMO进行协调,只是在发帖前与一位组织者告知了此事。出于对参赛学生的尊重,要求OpenAI等到闭幕式结束后再发布——「我们也照做了」。


对此,有人还精细计算了闭幕式和公开结果的时间差。

IMO闭幕式的时间在7月19日(当地时间)下午4点举行闭幕式,直播时间1小时43分钟,结束时间不晚于5点43分。



再来看负责人Alexander Wei的发文时间,7月19日下午3:50(东八区),也就是当地时间的5点50分。


从时间来看,确实是OpenAI在IMO闭幕式结束7分钟后,才发布了公告。

即便如此,网友们仍旧看不惯OpenAI炒作风暴,而且根本没有给获奖学生留有余地。



而且,可以确定的是,OpenAI公布的结果,并没有得到IMO官方认证。

未来几天,谷歌DeepMind会正式发布AI夺下IMO 2025细节。



马库斯愤怒抨击,太符合品牌调性了。


UCLA数学教授

LLM短期内不会取代人类

针对LLM拿下IMO金牌事件,来自UCLA应用数学教授Ernest Ryu发表了自己的看法。

1. OpenAI IMO P1-P5的解答目测是正确的。

2. 第6题是一个明显新颖且难度更高的问题。可以说第1-5题仍在「标准」IMO解题技巧范围内,但第6题需要创造性思维。


他表示,根据自己使用LLM进行数学研究的经验,Gemini的表现优于ChatGPT。

但OpenAI抢先在周六宣布了结果,而谷歌DeepMind「慢科研」学术作风,让他们输掉了这场公关战。

不过,Ernest Ryu认为,在短期内,大模型不会取代数学家。

因为数学研究是,解决那些目前「没有人」知道如何解决的问题(训练数据分布之外),即类似IMO P6题。这需要极大的创造力,OpenAI的模型在IMO解题中恰恰缺乏这种能力。


然而,对于那些人类已有能力解决的问题(训练数据分布之内),LLM只会变得愈加强大。

在数学研究中,人们会将现有技术与新创意相结合,LLM将显著加速前一部分工作的实现。

Ernest Ryu还预测,在接下来十年里,越来越多的数学家将借助LLM来搜索证明框架中的已知部分,从而提升研究效率。

老一辈数学家或许会对此唏嘘不已,但年轻一代只会继续产出优秀成果。

参考资料:

https://x.com/ns123abc/status/1947016206768046452 https://x.com/lmthang/status/1946960256439058844 https://x.com/Mihonarium/status/1947027989608190065


版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国大规模减持美债 一个月抛了超1800亿元

每日经济新闻 浏览 1 09-21

大湾区晚会太混乱!跑调抢拍忘词破音全占了,合唱几乎都翻车

萌神木木 浏览 0 09-29

小区现上百平米"超大号违建":涉嫌群租 多年未能处置

看看新闻Knews 浏览 8383 08-13

美国政府已持有英特尔9.9%股份

都市快报橙柿互动 浏览 0 08-23

2.0T+9AT动力 全新GL8陆上公务舱亮相

网易汽车 浏览 6392 06-23

欧洲市场,有望成为奇瑞销量增长的新“发动机”

禾颜阅车 浏览 3909 05-08

加速电动化转型 长安马自达EZ-60亮相即预订

网易汽车 浏览 4888 04-26

林俊杰自曝患心脏病,唱歌时无法站立表情痛苦

归史 浏览 3899 07-15

男子守候失明妻子12年 被称为"青岛即墨最深情的男人"

齐鲁壹点 浏览 2 09-02

甘肃233名幼儿血铅异常 涉案人员可能被判10年以上

看看新闻Knews 浏览 9905 07-09

足协评议:对杭州临平吴越VS无锡吴钩一例争议判罚不予认定和评议

直播吧 浏览 6143 07-31

初秋衣服不必准备太多,这几件单品提前买好,简单百搭不挑人

静儿时尚达人 浏览 0 09-27

苹果短期内不会在美国生产 iPhone,库克也承认将长期在海外组装

IT之家 浏览 9693 08-11

30kW外放电/续航1031km 长安猎手K50售12.79万元起

网易汽车 浏览 0 08-30

不知道衣服如何选择和搭配?夏季试试这些造型,美得毫不费力

静儿时尚达人 浏览 2 09-06

阿里、上汽孵化的斑马智行IPO!估值220亿却遭前CFO深夜炮轰

野马财经 浏览 0 08-25

5-1狂胜仍不敢怠慢!法鹰欧冠逆天赛程:马竞利物浦那不勒斯巴萨

直播吧 浏览 1 09-19

一汽奥迪A5L 23.98万起 豪华燃油智能轿车新纪元

网易汽车 浏览 9082 08-09

有专家称中国与伊朗达成协议以保护中国航运 中方回应

外交部网站 浏览 1199 08-12

财经早餐:中秋国庆旅游市场迎热潮;摩尔线程IPO过会拟募资80亿元

网易财经 浏览 1 09-29

健身效果堪比“整容”!她们保持好状态的秘密全都分享出来了

黎贝卡的异想世界 浏览 255 04-15
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2