关闭广告

英伟达推出OpenReasoning-Nemotron推理模型

IT之家2025-07-21 00:00:019188人阅读

IT之家 7 月 20 日消息,英伟达今日推出了全新推理模型套件 OpenReasoning-Nemotron。该套件包含四个基于 Qwen-2.5 微调的模型,参数规模分别为 1.5B、7B、14B 和 32B,全部源自 6710 亿参数的 DeepSeek R1 0528 大模型。通过“蒸馏”这一过程,英伟达成功将这一超大规模模型压缩成更轻量的推理模型,降低了部署门槛,使得即使在标准游戏电脑上也能进行高级推理实验,避免了高昂的 GPU 与云计算成本。


据IT之家了解,英伟达此次模型的核心优势并非在于训练手段的复杂创新,而是依托强大的数据支撑。公司利用 NeMo Skills 生成了 500 万个涵盖数学、科学与编程的解答数据集,并通过纯监督学习方式对模型进行微调。经测试,32B 模型在 AIME24 数学竞赛中获得 89.2 分,在 HMMT 2 月赛中达到 73.8 分,甚至最小的 1.5B 模型也分别拿下 55.5 和 31.5 分,展现出良好的推理与解题能力。



英伟达将 OpenReasoning-Nemotron 定位为科研探索的有力工具,四个模型的完整检查点将在 Hugging Face 开放下载,便于研究人员基于此进行强化学习等进一步实验,或针对特定任务定制优化。同时,模型支持“GenSelect 模式”,即每个问题可生成多种解答版本,通过筛选最优解来提升准确率。在该模式下,32B 模型在多项数学与编程基准测试中已达到甚至超越 OpenAI o3-high 的表现。

值得一提的是,英伟达此次模型训练全程未引入强化学习,仅采用监督微调,为社区提供了干净且处于技术前沿的起点,便于未来开展强化学习相关研究。对于拥有高性能游戏 GPU 的玩家及个人开发者而言,这套模型让本地运行接近业界最先进水平的推理模型成为现实。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

“AI外卖”乱象:虚假店铺图泛滥,平台监管亟待加强

三言科技 浏览 7868 07-26

TrendForce:苹果首款折叠iPhone将配备5.5英寸外屏与7.8英寸内屏

IT之家 浏览 9097 07-24

蔚来又融100亿,股价暴涨100%!李斌打响翻身仗

象视汽车 浏览 0 09-15

马卡:因辩方要求评估法官回避情况,马拉多纳死亡案预审暂停

懂球帝 浏览 394 07-19

张曼玉的平价穿搭火遍全网,60岁依然是大家最爱的穿衣榜样

黎贝卡的异想世界 浏览 9813 08-15

农夫山泉上半年营收256.22亿元,同比增长15.6%,平均一天收入1.42亿元

红星资本局 浏览 1 08-27

赵露思风波更多人下场?三位明星被波及?

老吴教育课堂 浏览 6510 08-16

中超第17轮观众人数:京沪德比62291人居首,英博61588人排第2

懂球帝 浏览 4083 07-20

2025款iPad Pro将配备双前置摄像头,解决竖屏Face ID失效问题

IT之家 浏览 8206 07-21

“后妈裙”今年夏天火炸了,这样穿时髦精致又气质

LinkFashion 浏览 2317 06-21

7280亿风口!巨头爆买无人车,资本纷纷涌入

深眸财经 浏览 1 09-21

记者:格雷米奥乐观能免签阿图尔,提前解约尤文将亏损1100万

懂球帝 浏览 9659 08-18

宗馥莉被3名自称同父异母弟妹起诉,娃哈哈遗产争夺该咋看?

江瀚视野 浏览 7952 07-17

伊朗外长: 下一轮伊美核问题谈判将于26日举行

观察者网 浏览 5802 04-20

轻松!孙颖莎/王曼昱3-0金娜英/柳韩娜,晋级瑞典大满贯女双决赛

直播吧 浏览 1 08-23

一季度亏67亿 蔚来穿越什么周期才能盈利?

汽势传媒 浏览 2267 06-06

高管匿名投票除弗拉格外最佳新秀:VJ第1 哈珀第2 杨瀚森获得1票

直播吧 浏览 4200 07-25

大六座/超大前备箱 乐道L90将于7月上旬预售

网易汽车 浏览 395 06-27

真爱大牌返场|| 回购多年的牌子,这次竟然100+就能入手

黎贝卡的异想世界 浏览 0 08-22

港股东方甄选早盘一度涨近15%

中新经纬 浏览 9581 08-20

林志玲一家三口游玩环球影城,“老公抱娃”引网友热议

乡野小珥 浏览 8052 07-07
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2