关闭广告

英伟达推出OpenReasoning-Nemotron推理模型

IT之家2025-07-21 00:00:019204人阅读

IT之家 7 月 20 日消息,英伟达今日推出了全新推理模型套件 OpenReasoning-Nemotron。该套件包含四个基于 Qwen-2.5 微调的模型,参数规模分别为 1.5B、7B、14B 和 32B,全部源自 6710 亿参数的 DeepSeek R1 0528 大模型。通过“蒸馏”这一过程,英伟达成功将这一超大规模模型压缩成更轻量的推理模型,降低了部署门槛,使得即使在标准游戏电脑上也能进行高级推理实验,避免了高昂的 GPU 与云计算成本。


据IT之家了解,英伟达此次模型的核心优势并非在于训练手段的复杂创新,而是依托强大的数据支撑。公司利用 NeMo Skills 生成了 500 万个涵盖数学、科学与编程的解答数据集,并通过纯监督学习方式对模型进行微调。经测试,32B 模型在 AIME24 数学竞赛中获得 89.2 分,在 HMMT 2 月赛中达到 73.8 分,甚至最小的 1.5B 模型也分别拿下 55.5 和 31.5 分,展现出良好的推理与解题能力。



英伟达将 OpenReasoning-Nemotron 定位为科研探索的有力工具,四个模型的完整检查点将在 Hugging Face 开放下载,便于研究人员基于此进行强化学习等进一步实验,或针对特定任务定制优化。同时,模型支持“GenSelect 模式”,即每个问题可生成多种解答版本,通过筛选最优解来提升准确率。在该模式下,32B 模型在多项数学与编程基准测试中已达到甚至超越 OpenAI o3-high 的表现。

值得一提的是,英伟达此次模型训练全程未引入强化学习,仅采用监督微调,为社区提供了干净且处于技术前沿的起点,便于未来开展强化学习相关研究。对于拥有高性能游戏 GPU 的玩家及个人开发者而言,这套模型让本地运行接近业界最先进水平的推理模型成为现实。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

刘嘉玲问刘晓庆:现在接戏的角色是否有限?

红星新闻 浏览 17 10-17

狼队官方:31岁队长塞梅多离队;球员共为狼队出战182场

懂球帝 浏览 3583 07-31

马克龙要建欧洲有史以来最大航母 "掠食者"表述不寻常

新京报 浏览 14 12-24

沪指半日涨0.3% 两市成交额超1.6万亿

网易财经 浏览 4487 08-19

队报:多支英超球队有意李刚仁,但巴黎留住他的态度十分坚决

懂球帝 浏览 17 08-22

晕了晕了!宽基指数ETF遭主力抛售逾2000亿元!别慌,超百只行业主题ETF正被资金抢筹(附名单)

每经牛眼 浏览 13 01-18

黄海冰回母校中戏吃饭,自曝20年没回来,读书时最羡慕王志文老师

温柔娱公子 浏览 8650 07-11

陈萃:全新MG4有秘密武器 将成ID.3巨大挑战

网易汽车 浏览 7878 07-09

“这个颜色”今天春天又火了!这样穿好看又减龄

LinkFashion 浏览 7 03-17

创新推出ACE SXFI蓝牙耳机,699元

IT之家 浏览 11 12-24

未成年女性称被爱泼斯坦当"孵化器" 还遭公司高管强奸

红星新闻 浏览 19 02-05

阿尔特塔:我们会对英联杯全力以赴;热苏斯的斗志非常出色

懂球帝 浏览 12 12-23

当一个57岁的女人,决定从零开始

Yuki女人故事 浏览 18 01-11

已获海港等队邀约,茹子楠表态站好梅州这班岗:拼到最后一秒

懂球帝 浏览 14 11-17

AI新贵Perplexity豪赌:想买30亿用户的Chrome

财联社 浏览 1799 08-13

从高光到至暗 广汽菲克工厂腰斩价无人接盘宣布破产

道哥说车 浏览 7251 07-10

伊万回应西西帕斯,现在什么都不让说了,罗迪克力挺大威拿外卡

网球之家 浏览 3775 07-26

加快核反应堆测试 美总统签署有关核能发展行政命令

新京报 浏览 1981 05-25

岳阳开放大学建全国首家烧烤学院 副校长:想认真做好

红星新闻 浏览 1744 08-16

媒体人:王奕博为转会愿放弃编制 但若未及时获批或将缺席新赛季

直播吧 浏览 2964 08-12

这一天:杨幂蚂蚁腰无敌了,赵丽颖生图抗打,陈坤咋长这样了

娱乐圈笔娱君 浏览 14 01-16
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2