关闭广告

英伟达推出OpenReasoning-Nemotron推理模型

IT之家2025-07-21 00:00:019201人阅读

IT之家 7 月 20 日消息,英伟达今日推出了全新推理模型套件 OpenReasoning-Nemotron。该套件包含四个基于 Qwen-2.5 微调的模型,参数规模分别为 1.5B、7B、14B 和 32B,全部源自 6710 亿参数的 DeepSeek R1 0528 大模型。通过“蒸馏”这一过程,英伟达成功将这一超大规模模型压缩成更轻量的推理模型,降低了部署门槛,使得即使在标准游戏电脑上也能进行高级推理实验,避免了高昂的 GPU 与云计算成本。


据IT之家了解,英伟达此次模型的核心优势并非在于训练手段的复杂创新,而是依托强大的数据支撑。公司利用 NeMo Skills 生成了 500 万个涵盖数学、科学与编程的解答数据集,并通过纯监督学习方式对模型进行微调。经测试,32B 模型在 AIME24 数学竞赛中获得 89.2 分,在 HMMT 2 月赛中达到 73.8 分,甚至最小的 1.5B 模型也分别拿下 55.5 和 31.5 分,展现出良好的推理与解题能力。



英伟达将 OpenReasoning-Nemotron 定位为科研探索的有力工具,四个模型的完整检查点将在 Hugging Face 开放下载,便于研究人员基于此进行强化学习等进一步实验,或针对特定任务定制优化。同时,模型支持“GenSelect 模式”,即每个问题可生成多种解答版本,通过筛选最优解来提升准确率。在该模式下,32B 模型在多项数学与编程基准测试中已达到甚至超越 OpenAI o3-high 的表现。

值得一提的是,英伟达此次模型训练全程未引入强化学习,仅采用监督微调,为社区提供了干净且处于技术前沿的起点,便于未来开展强化学习相关研究。对于拥有高性能游戏 GPU 的玩家及个人开发者而言,这套模型让本地运行接近业界最先进水平的推理模型成为现实。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

黎智英等9名被告人一连4日进行求情 香港大量警员戒备

扬子晚报 浏览 17 01-13

欧足联临时禁赛普雷斯蒂安尼依据:捂嘴、维尼修斯&姆巴佩证词等

懂球帝 浏览 5 02-24

俄美领导人会晤为何被“推迟” 俄外长披露原因

每日经济新闻 浏览 9 10-27

全新雷克萨斯ES纯电版尺寸/内饰升级 外观引争议?

车品 浏览 5649 06-13

50+姐姐秋冬穿对赢麻了!别硬凹少女感,3个技巧穿出显贵感

静儿时尚达人 浏览 14 11-17

方媛生三胎后现身芜湖,摘墨镜气血不足显憔悴

小椰的奶奶 浏览 13 01-20

原来他们是夫妻,恩爱27年无绯闻.现是影协主席

冷紫葉 浏览 17 09-29

马斯克称赞:可能在5年内超越!

都市快报橙柿互动 浏览 13 10-28

731部队原队员揭秘细菌战实施细节

极目新闻 浏览 4014 07-08

一篇搞懂:飞书多维表格、n8n、Dify 等自动化工作流里的 Webhook 到底是个啥

钛媒体APP 浏览 8 10-11

电动“清洁”时刻:BMW i5、Lucid Air和蔚来ET7

ams车评网 浏览 6524 05-10

置换一口价7.28万起 2026款宝骏悦也Plus上市

网易汽车 浏览 2751 05-29

7月买车正当时?数十家车企发布优惠新政

车神探 浏览 6715 07-05

永辉“补充”流动性,拟定增募资39.9亿

商业观察家 浏览 5932 07-31

看到邓超陈赫对鹿晗的好,明白友谊比爱情更坚固

白面书誏 浏览 7553 07-05

广西平果球员:俱乐部没找我们签字,解散都是从网上知道的

懂球帝 浏览 7 12-29

女生被同学殴打13次后确诊精神分裂 当地启动全面复查

大风新闻 浏览 9 11-03

SUV版MEGA上市!理想i8售价32.18万起,李想这次对了吗?

中新经纬 浏览 7914 07-30

世体:巴萨本周二召开董事会会议,讨论诺坎普开放的议题

懂球帝 浏览 7806 07-23

上海集成电路产业版图再落一子,长电科技今天在沪投产

上观新闻 浏览 2 03-11

里程碑,南通支云球员陈彬彬俱乐部生涯出战100场比赛

懂球帝 浏览 9003 08-19
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2