关闭广告

跨南北、贯东西,支持千公里级跨域混训!上海发布超大规模跨域混训技术方案

上观新闻2025-07-20 00:00:012014人阅读



今天(19日),上海人工智能实验室发布DeepLink超大规模跨域混训技术方案,并已完成多个项目落地,支持千公里多智算中心跨域长稳混训千亿参数大模型。

今年2月,上海AI实验室联合十余家合作伙伴,在上海建成了超大规模跨域混训集群原型,并实现千亿参数大模型20天不间断训练。在此基础上,上海AI实验室融合中国联通AINET技术,跨越1500公里连接了上海和济南之间的智算中心,完成千亿参数大模型混训,等效算力达单芯片单集群算力的95%以上;与中国电信息壤算网合作,实现了北京、上海与贵州等多地智算中心的互联和大模型混训。

为高灵活、低成本获取大算力提供新途径

随着国内AI研究及产业应用日益深化,算力需求持续增长,全国智算中心大规模兴建,但存在建设分散、采购芯片代次差异大、算力资源碎片化等问题,难以灵活、低成本地获取大算力。

上海AI实验室攻克了大规模跨域异构集群调度、高性能通信协议整合、高可靠容错机制设计等技术难题,有效应对硬件算力参差不齐、通信同步不稳定、故障容错难等挑战,推出DeepLink超大规模跨域混训技术方案,以保障跨域智算集群的大模型长稳训练。


DeepLink超大规模跨域混训技术方案

破解效率低、不稳定、难协同三大难题

智算芯片行业百花齐放,但不同芯片的软件栈及性能存在差异,异构互联通信效率低下,导致适配纳管难度大、混训效率不高。且大规模远距离跨域混训需要解决网络带宽、通信延迟、训练稳定性等问题。

针对远距离跨域混训存在的数据同步和稳定性问题,这一技术方案创新性地采用“3D并行+PS”架构,将超大规模任务分发到各个智算中心,通过算法换通信的方式减少全局同步复杂度和通信开销,有效减轻了网络负担,为数据传输提供了更宽松的时间窗口,普通专线即可满足通信带宽的要求;还确保在异地训练中即使某个智算中心的节点发生故障也不影响整体训练,整体提升训练稳定性。


“3D并行+PS”架构

针对芯片种类繁多,不同硬件显存容量和通信带宽参差不齐导致的异构混训效率低下难题,本方案同时提出改进的异构流水线并行策略,并采用自研分布式并行框架动态调节不同硬件的任务量,以更细粒度的拆分方式解决了异构芯片差异性带来的负载均衡和计算阻塞问题。联合团队基于现有通信协议构建适配层,成功突破了异构芯片互联效率低下的瓶颈。

携手上下游,助力AI生态繁荣

AI生态蓬勃发展,离不开算力资源高效盘活。作为国际级人工智能新型科研机构,上海AI实验室采取有组织的科研范式,发挥原创算法及AI软硬件深度互联技术优势,在全国算力互联互通探索中抢先布局、不断突破。

DeepLink方案不仅验证了跨域混训的实用价值,也为行业提供了全新启示。在计算资源有限的场景下,行业依旧可以实现不同性能芯片的灵活组合,无需依赖高算力芯片“扎堆”式部署,有效降低对特定硬件的路径依赖;不同算力集群可通过互联组合形成“合力”,突破单集群性能上限;跨厂商资源更好地兼容与协作,为算力生态的多元繁荣奠定基础。


DeepLink超大规模跨域混训技术快速集成方案

新民晚报记者了解到,目前,上海AI实验室DeepLink开放计算体系已深度集成至联通、电信、商汤、仪电等智算平台,实现“1个平台+N种芯片+X个地域”稳定运行。

原标题:《跨南北、贯东西,支持千公里级跨域混训!上海发布超大规模跨域混训技术方案》

栏目编辑:王蔚 题图来源:上观题图 图片来源:采访对象供图

来源:作者:新民晚报 郜阳

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

牛市来了?

智本社 浏览 6768 07-30

中国信达“新帅”落定 宋卫刚出任总裁

21金融圈 浏览 14 01-07

冬天穿衣其实很简单!上短下长、加点亮色,高级舒适又耐看

静儿时尚达人 浏览 15 01-05

与张艺谋分手30年,巩俐嫁76岁法国老头难逃

喜欢历史的阿繁 浏览 873 07-27

25万级大六座SUV 吉利银河M9 8月23日开启预售

网易汽车 浏览 4159 08-16

央视:杨瀚森已经确认归队,将很有可能现身此次热身赛

懂球帝 浏览 6280 07-24

击落“死神”、逼退B-2:胡塞武装防空火力令美军头疼

国际在线 浏览 1584 04-29

李昊:五年、十年后的未来,我希望代表中国队站在世界杯赛场

懂球帝 浏览 3 04-29

赵丽颖带儿子逛街,牵“想想”手过马路母爱满满,本人火速回应

扒虾侃娱 浏览 17 09-20

抠门年轻人,开始流行买“顶配猫砂”

DT商业观察 浏览 15 11-12

官方:因看台有医疗紧急情况,富勒姆vs利物浦推迟15分钟开球

懂球帝 浏览 13 01-05

“衣越素、人越贵”,这才是中年女性的高级穿搭法则,太实用

静儿时尚达人 浏览 3876 05-23

没招了,拜到真·时髦祖师奶

时尚COSMO 浏览 17 08-23

AMD 锐龙 9000F / PRO 9045 处理器接近发售,已上线海外电商

IT之家 浏览 15 09-02

泡泡玛特比Gucci赚钱|氪金·大事件

36氪财经 浏览 2019 08-21

继续扩大军事行动 以色列启动"夺取加沙城"被强烈谴责

环球网资讯 浏览 17 08-22

安全测试变“碰碰车”:车企如何自证?

网易汽车 浏览 7937 08-02

贝克汉姆和长子彻底闹掰!布鲁克林:我们只能通过律师沟通

素素娱乐 浏览 8 01-11

领先英伟达AMD一代!华为将首次线下展出昇腾384颗自研芯片AI方案 算力无敌

快科技 浏览 7635 07-19

想买全新大型SUV?三四季度还有3款新车要来

优视汽车 浏览 22 09-14

有了AI,课堂如何“教”与“学”?

看看新闻Knews 浏览 16 10-27
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2