关闭广告

OpenAI自嗨“国际奥数金牌”遭官方怒斥

量子位2025-07-22 00:00:016760人阅读

梦晨 鹭羽 发自 凹非寺
量子位 | 公众号 QbitAI

OpenAI声称新模型获得IMO金牌不到24小时,剧情就出现了大反转!

多位IMO官方人士和学界大佬纷纷发声,直指OpenAI的做法“粗鲁且不恰当”

IMO主办方要求AI公司在闭幕式一周后再公布结果,让关注的焦点留在参赛的青少年上,然而OpenAI偏偏选择在闭幕式刚结束就急不可耐地宣布了成绩。

有网友评价:OpenAI一如既往的为了炒作什么都干得出来。没有官方分数,没有耐心,也没有羞耻心。



更劲爆的是,OpenAI自称的“金牌”成绩可能根本站不住脚:

OpenAI并不是与IMO合作测试模型的AI公司之一,91位IMO官方评委中没有任何人参与评估他们的答卷。这意味着,OpenAI的”金牌”成绩完全是自说自话,没有经过官方认证。



原本以为是AI发展的里程碑时刻,没想到引发了一场关于学术道德和商业炒作的激烈争论。

IMO官方怒了:”请给孩子们留点空间”

事情的导火索来自一位IMO资深人士的爆料。

Joseph Myers,这位从1992年就参与数学奥赛的元老级人物,与IMO秘书长Ria van Huffel进行了一番交谈。

IMO评审团和协调员们普遍认为,AI开发商在IMO期间(尤其是闭幕式之前)宣布成绩是”粗鲁且不恰当的”。官方期望AI公司在闭幕式后至少等待一周再发布结果。



OpenAI方面,则由参与这项研究的Noam Brown出面回应。

他的发言承认了OpenAI没有事先与IMO官方取得联系,只是在发布成绩之前告知了一位组织者,组织者要求他们在闭幕式之后再宣布成绩。

这与爆料中的要求闭幕式一周之后出现了矛盾。



那么事情到底如何呢?

另一家参加比赛的AI团队Harmonic的公告证实,确实有“闭幕式一周之后”这个要求,而且给出了具体时间期限7月28日之后。



就在OpenAI高调宣布成绩的同时,另一家AI巨头谷歌DeepMind却很克制,与OpenAI的张扬形成鲜明对比。

多位知情人士透露,DeepMind可能也取得了金牌水平的成绩,但他们选择遵守IMO的要求,静静等待合适的时机。

除了公告发布时间的问题,OpenAI到底得没得金牌也有争议。

领导DeepMind超级推理团队的Thang Luong补充,IMO内部其实有一份官方评分指南,外部无法获取。没有基于该指南的评分就没有资格获得奖牌。

这届IMO共6道题,每题7分。金牌线35分,OpenAI自报的成绩也刚刚过线,即使是解答过程中微小的扣分都可能让OpenAI从金牌跌到银牌



总之这场IMO金牌之争还远未结束,一切还是以经过IMO主办方认证的成绩为准。

One More Thing

最后让我们将聚光灯交还给人类金牌选手。

最终成绩中,中国队以全员6金牌、总分231分占据榜首,继去年以2分之差遗憾输给老对手美国队后,再度重返世界第一。

第二名则是美国队,获得了5金一银,然后依次是韩国、日本和波兰。



中国队的六位选手分别是来自武昌实验中学的邓哲文、武汉市经开外国语高级中学的徐祺铭谈弘毅、重庆巴蜀中学的张恒烨、杭州学军中学的董镇宇,以及上海中学的邓乐言



其中邓哲文徐祺铭都曾参与过2024年的IMO并成功摘金,而徐祺铭更是在去年成功入选2025年北大数学英才班。

董镇宇则是团队中唯一的高三年级,虽然他早在高一就进入国家集训队并被保送至清华姚班,但前两年的选拔中都与IMO国家队擦肩而过。

这是他第三次冲击国家队,终于百折不挠圆梦IMO。

谈弘毅在连续两年凭借中国数学奥林匹克竞赛(CMO)金牌入选国家集训队后,也同样获得了清华北大保送资格。

另外,邓乐言和张恒烨在本次IMO拿下满分42分,并列世界第一,这也是中国队从2019年起,连续7届IMO均有选手获得满分。

其中,邓乐言是中国队中年级最小的一位,只有高一的他,在去年CMO以满分成绩入选国家集训队,又在IMO国家队选拔中脱颖而出,刷新了上海近10年来IMO选手的最小年龄纪录。

去年,他还在阿里巴巴全球数学竞赛中的组合与概率赛道获得全球第五名,也是首位获得该项赛事奖牌的中学生。

张恒烨曾在2023年CMO中获得金牌并入选国家队,后来同样在阿里巴巴全球数学竞赛中获奖。去年入选国家队后,他还主动前往北大数学系旁听并受益匪浅。

要知道,本次IMO中,全球600多位参赛者,只有6人获得满分,其他所有人几乎都输在了第六题——组合数学上,这也是OpenAI唯一没有攻克的那道题。



另外,下一届IMO将在上海中学举办,上海中学至今已获得18块IMO金牌,总数位居全国第一,它也将成为全球第一所承办国际数学奥林匹克的中学。



值得注意的是,今年IMO的前30名参赛者,几乎都是亚洲或东欧面孔。



而亚军美国队也是清一色的亚洲面孔。



网友表示,也许未来的数学竞赛将是中国队vs美国队vs人工智能。



参考链接:
[1]https://x.com/HarmonicMath/status/1947023450578763991
[2]https://www.imo-official.org/
[3]https://x.com/ai_for_success/status/1946984782178709719
[4]https://x.com/lmthang/status/1946960256439058844

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

关于今年金球奖?穆帅:维蒂尼亚和门德斯,我希望其中一个能获奖

直播吧 浏览 4390 07-24

AMG CLA 45 EQ曝黑科技:三电机+升降尾翼

网上车市 浏览 9056 07-01

吕丽君女儿正脸照罕曝光,犹如翻版刘銮雄!

娱乐团长 浏览 11 12-24

内需复苏叠加“反内卷” 聚焦两大方向投资机遇

证券时报 浏览 10 02-24

两年袭击中东七国 以色列下一个目标是谁

上观新闻 浏览 12 09-13

《生万物》大结局收官,三件事却令人意想不到!

电和影 浏览 19 08-27

芯片圈最离谱的“CP”,即将改写行业规则

虎嗅APP 浏览 10 09-20

恩里克:要想取得和去年一样的成功,要敢于走出舒适区且提升自己

直播吧 浏览 1049 08-18

网红基金,历史性暴跌

中国新闻周刊 浏览 5 02-04

基多大学2-0博塔弗戈,比利亚米尔破门,阿尔苏加雷锦上添花

懂球帝 浏览 13 08-22

离婚后陈赫前妻秀恩爱,老公和陈赫截然相反

林轻吟 浏览 5863 07-31

官方首次披露龚晓莉已被查:在考试录用中泄露试题

新京报 浏览 20 11-04

鼎佳精密登陆北交所在即 上半年利润预估增长超3成

叩叩财讯 浏览 169 07-18

长春汽博会:感受中国汽车产业“向新力”

吉林日报 浏览 2616 07-17

尼帕病毒疫情扰动全球神经,A股病毒防治板块逆势拉升

览富财经网 浏览 9 01-27

记者:热刺在争夺埃泽中占据有利,阿森纳因财务问题难签罗德里戈

直播吧 浏览 245 08-14

英伟达拟向英国自动驾驶初创企业 Wayve 投资 5 亿美元

IT之家 浏览 13 09-20

他被谢霆锋打成重伤,如今怎么样了?

卷史 浏览 11 10-22

星二代,太阳报:古德约翰森19岁的儿子丹尼尔接近转会谢菲联

懂球帝 浏览 4542 07-20

陈航回归,叶军离职,钉钉变阵

节点财经 浏览 1046 07-21

提供两驱/四驱双动力 乐道L90最高续航605公里

网易汽车 浏览 9309 05-23
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2