关闭广告

英伟达推出OpenReasoning-Nemotron推理模型

IT之家2025-07-21 00:00:019202人阅读

IT之家 7 月 20 日消息,英伟达今日推出了全新推理模型套件 OpenReasoning-Nemotron。该套件包含四个基于 Qwen-2.5 微调的模型,参数规模分别为 1.5B、7B、14B 和 32B,全部源自 6710 亿参数的 DeepSeek R1 0528 大模型。通过“蒸馏”这一过程,英伟达成功将这一超大规模模型压缩成更轻量的推理模型,降低了部署门槛,使得即使在标准游戏电脑上也能进行高级推理实验,避免了高昂的 GPU 与云计算成本。


据IT之家了解,英伟达此次模型的核心优势并非在于训练手段的复杂创新,而是依托强大的数据支撑。公司利用 NeMo Skills 生成了 500 万个涵盖数学、科学与编程的解答数据集,并通过纯监督学习方式对模型进行微调。经测试,32B 模型在 AIME24 数学竞赛中获得 89.2 分,在 HMMT 2 月赛中达到 73.8 分,甚至最小的 1.5B 模型也分别拿下 55.5 和 31.5 分,展现出良好的推理与解题能力。



英伟达将 OpenReasoning-Nemotron 定位为科研探索的有力工具,四个模型的完整检查点将在 Hugging Face 开放下载,便于研究人员基于此进行强化学习等进一步实验,或针对特定任务定制优化。同时,模型支持“GenSelect 模式”,即每个问题可生成多种解答版本,通过筛选最优解来提升准确率。在该模式下,32B 模型在多项数学与编程基准测试中已达到甚至超越 OpenAI o3-high 的表现。

值得一提的是,英伟达此次模型训练全程未引入强化学习,仅采用监督微调,为社区提供了干净且处于技术前沿的起点,便于未来开展强化学习相关研究。对于拥有高性能游戏 GPU 的玩家及个人开发者而言,这套模型让本地运行接近业界最先进水平的推理模型成为现实。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

搭载华为辅助驾驶 岚图追光L谍照曝光

车质网 浏览 6331 08-05

官方:米兰签下热那亚后卫德温特;据悉转会费2000万欧

懂球帝 浏览 3275 08-14

孙颖莎王曼昱横扫进决赛!采访强调默契越来越好,孙颖莎仍展情商

篮球资讯达人 浏览 10 08-23

拉卡拉赴港上市迷局:减持潮、业绩滑坡与合规危机的三重困境

经理人杂志 浏览 7386 07-21

比亚迪仰望U9新版申报

大象新闻 浏览 1177 08-11

智元机器人与龙旗科技深度合作开发工业场景具身智能机器人应用

财闻 浏览 10 10-09

智驾下一个关键挑战,是不被别人摘“桃子”?

虎嗅APP 浏览 11 11-27

漂亮饭“围攻”江浙沪

餐饮老板内参 浏览 5916 07-21

队报:比赛中拉门斯的长传频繁且精准,推动了曼联的战术转型

懂球帝 浏览 10 11-01

从"北大废物"到暴瘦女神:李雪琴用30斤体重,找回了“自己”

娱乐白名单 浏览 4224 07-09

两年净利增长5倍!6大券商保驾护航!这家轮胎龙头冲刺上市!

IPO日报 浏览 3083 07-18

理想汽车11月交付33,181辆 累计交付1,495,969辆

网易汽车 浏览 9 12-02

劣迹艺人赵薇走投无路 15岁女儿成最后一根稻草?

深析古今 浏览 2465 08-07

是谁想的给迪丽热巴穿新中式?

时尚COSMO 浏览 2604 06-27

《寂静的朋友》全亚洲登陆,梁朝伟出演大尺度镜头,很可能被删减

最爱酷影视 浏览 12 10-13

尹同跃:精简30%会议 把员工时间当时间

盖世汽车 浏览 9281 08-06

传递足球正能量,多家俱乐部转发中足联声明

懂球帝 浏览 1559 07-20

德米纳尔救赛点夺第十冠,90后冠军数排行榜上能列第几?

网球之家 浏览 5658 07-30

博主:曼联希望塞斯科本人主动推动转会,维维尔正在游说他

直播吧 浏览 3240 07-31

越来越多的园区,开始“0租金”了

快刀财经 浏览 17 08-23

业主私挖300平地下室:白天用挖机挖 半夜偷偷运土

扬子晚报 浏览 15 10-14
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2