关闭广告

中国移动“九天”通用基础大模型 3.0 发布,核心技术开源

IT之家2025-07-27 00:00:021839人阅读

IT之家 7 月 26 日消息,在今日的 2025 世界人工智能大会“AI 焕新产业共赢”企业人工智能产业发展论坛上,中国移动焕新发布“九天”基础大模型 3.0


本次发布的“九天”基础大模型 3.0 是国务院国资委战新“百大工程”的新成果,进一步强化了“高安全、高可控、全国产、全行业”四大特性,重点实现三大焕新:

一、九天众擎语言大模型实现架构与性能双重跃迁。

模型突破性采用可扩展至万亿级的 MoE 架构,以 15T token 多阶段配比预训练数据与全流程治理体系强化推理能力,创新构建 113 域 ×53 能力的二维分级后训练框架,结合动态强化学习策略,驱动复杂推理能力提升 35%。

在 GPQA-Diamond 评测中,“九天”以 77.67 分斩获全球第二,超越 DeepSeekR1 和 Qwen3;在 ArenaHard V0.1 中,以 67.2 分位居全球第一;在 BFCL V3 评测中,达到 68 分。性能跃升的同时,模型进一步强化了可控生成能力,破解沉浸式角色演绎,精确流程内置等技术细节,实现了专业场景零幻觉。

基于最新的语言大模型,中国移动此次也推出多个专项模型。九天代码大模型使用两阶段的持续训练技术,支持代码生成、注释生成、单元测试生成、代码智能问答等多种任务,支持 Python、Java、JS、TS、Go、C++ 等 10 + 种主流编程语言。

指标方面,在 EvalPlus、MHPP、LivecodeBenchv6 等多个代码生成榜单上成绩领先。九天数学大模型,短思考、长思考模式均达到业界 SOTA 水平,多项指标超过 Qwen 2.5 Math、Qwen3、DeepSeek Math、DeepSeek R1-Distill 等同参数量级模型。

二、九天善智多模态大模型全面提升生成可控性与理解能力。

模型基于复杂时空建模、流匹配图片视频渐进式联合训练、端到端局部可控注意力机制等创新,同时引入多模态理解信息提升对文本指令和输入条件图像视频的感知能力,联合图文交织数据训练,实现既能生成高质量的图像视频,又能进行多轮对话式高可控精确编辑操作,显著提升了视觉生成的灵活便利性。

例如,在图片生成功能方面可支持多轮精准局部修改,如修改文字、修改背景、增加元素等。

模型在图理解和视频理解方面的性能表现也全面提升。

  • 图理解方面,在 MMStar、HallusionBench 和 OCRBench 等图理解任务中,九天模型分别获得了 82.2、64.3 和 94.9 的高分,处于业界领先水平;
  • 视频理解方面,九天模型在 Videomme 和 MVbench 两个任务中均表现领先超过 Qwen2-VL 和 InternVideo2。
三、模型及核心技术开源。
  • 一是开源九天数童结构化数据大模型,开源内容包括 JT-DA-8B 模型及后续演进版本,支持下载模型权重、微调代码、推理代码等;
  • 二是开源九天数学大模型,开源内容包括 JT-Math-8B 系列模型,支持下载模型权重、推理代码、技术报告;
  • 三是开源九天代码大模型,开源内容包括 JT-Coder-8B 系列模型,支持下载模型权重、推理代码、技术报告;
  • 四是开源业界首创的结构化数据模型评测数据及 TReB 评测体系,测评体系涵盖 6 大任务、34 个能力,包括了高质量且全面的数据、推理模式及评价指标,支持下载评测数据集、测试代码;
  • 五是开源 CCR-Bench 行业场景复杂指令遵循评测数据集,该数据集涵盖 174 条高质量、多样化、高难度复杂指令数据,高度模拟健康专家、智能客服、医疗助手等典型工业场景,支持下载数据集。

以上内容已上线焕新社区、Github、HuggingFace、魔搭社区、Gitee、Arxiv。

IT之家从论坛获悉,中国移动九天人工智能研究院计划 8 月推出此次发布内容的技术深度解读

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

NVIDIA研究团队打造"思考-表达"双模式AI

科技行者 浏览 14 01-23

减重5.9kg 福特Mustang GTD裸碳版官图发布

车质网 浏览 9662 08-18

瓜罗:米兰放弃莱昂尼转攻德温特;国米将主攻卢克曼交易

懂球帝 浏览 8264 08-11

穿对是“女神”,穿错是“村姑”!仙女裙这么穿也太好看洋气了吧

Yuki女人故事 浏览 8251 04-07

润田创始人之妻称老公结婚4次5个小孩:卖水的可挣钱了

每日经济新闻 浏览 8236 07-23

重马一跑者倒地去世 跑友:他在跑圈被称为"破三大神"

红星新闻 浏览 16 01-21

标配激光雷达和四驱 魏牌高山7上市售28.58万

网易汽车 浏览 13 10-17

【进博时刻】每天训它几百遍,这份枯燥的工作并非冷冰冰

上观新闻 浏览 11 11-06

“DeepSeek问世半年影响仍在,改写了业界思维方式”

观察者网 浏览 602 08-13

首届机器人“奥运会”结束:宇树狂揽径赛金牌,障碍赛75%队伍未完赛

第一财经资讯 浏览 7158 08-18

视频:美公布在委内瑞拉附近扣押油轮行动画面

央视新闻客户端 浏览 12 12-11

舒享体验全面升级 新款别克E5内饰官图发布

网易汽车 浏览 7700 06-12

任期尚有两年多,年薪148万的绝味食品财务总监辞职了

国际金融报 浏览 4392 07-29

2025中国生物制造科技创新论坛将在常德举办 聚焦产业创新与融合发展

环球网资讯 浏览 17 08-23

白酒巨头一季报业绩普降,白酒拐点临近还是拐点远未到来?

郭施亮 浏览 2 04-29

格拉斯纳:恩凯提亚、杜库雷都无缘社区盾,埃泽和格伊肯定会出场

直播吧 浏览 3754 08-10

越南U21女排因有球员未通过染色体检测,世锦赛成绩被取消

懂球帝 浏览 640 08-13

历史性突破:中国战队提前锁定“机器人足球世界杯”冠亚军

IT之家 浏览 7601 07-21

留给李家的时间,就两天了

大猫研究所Pro 浏览 1011 07-26

《余生有涯》:就算原生家庭烂,也别劝我投降

澎湃新闻 浏览 12 10-18

智元机器人或借壳上市 上纬新材9连板

网易财经 浏览 9076 07-21
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2