关闭广告

跨南北、贯东西,支持千公里级跨域混训!上海发布超大规模跨域混训技术方案

上观新闻2025-07-20 00:00:012011人阅读



今天(19日),上海人工智能实验室发布DeepLink超大规模跨域混训技术方案,并已完成多个项目落地,支持千公里多智算中心跨域长稳混训千亿参数大模型。

今年2月,上海AI实验室联合十余家合作伙伴,在上海建成了超大规模跨域混训集群原型,并实现千亿参数大模型20天不间断训练。在此基础上,上海AI实验室融合中国联通AINET技术,跨越1500公里连接了上海和济南之间的智算中心,完成千亿参数大模型混训,等效算力达单芯片单集群算力的95%以上;与中国电信息壤算网合作,实现了北京、上海与贵州等多地智算中心的互联和大模型混训。

为高灵活、低成本获取大算力提供新途径

随着国内AI研究及产业应用日益深化,算力需求持续增长,全国智算中心大规模兴建,但存在建设分散、采购芯片代次差异大、算力资源碎片化等问题,难以灵活、低成本地获取大算力。

上海AI实验室攻克了大规模跨域异构集群调度、高性能通信协议整合、高可靠容错机制设计等技术难题,有效应对硬件算力参差不齐、通信同步不稳定、故障容错难等挑战,推出DeepLink超大规模跨域混训技术方案,以保障跨域智算集群的大模型长稳训练。


DeepLink超大规模跨域混训技术方案

破解效率低、不稳定、难协同三大难题

智算芯片行业百花齐放,但不同芯片的软件栈及性能存在差异,异构互联通信效率低下,导致适配纳管难度大、混训效率不高。且大规模远距离跨域混训需要解决网络带宽、通信延迟、训练稳定性等问题。

针对远距离跨域混训存在的数据同步和稳定性问题,这一技术方案创新性地采用“3D并行+PS”架构,将超大规模任务分发到各个智算中心,通过算法换通信的方式减少全局同步复杂度和通信开销,有效减轻了网络负担,为数据传输提供了更宽松的时间窗口,普通专线即可满足通信带宽的要求;还确保在异地训练中即使某个智算中心的节点发生故障也不影响整体训练,整体提升训练稳定性。


“3D并行+PS”架构

针对芯片种类繁多,不同硬件显存容量和通信带宽参差不齐导致的异构混训效率低下难题,本方案同时提出改进的异构流水线并行策略,并采用自研分布式并行框架动态调节不同硬件的任务量,以更细粒度的拆分方式解决了异构芯片差异性带来的负载均衡和计算阻塞问题。联合团队基于现有通信协议构建适配层,成功突破了异构芯片互联效率低下的瓶颈。

携手上下游,助力AI生态繁荣

AI生态蓬勃发展,离不开算力资源高效盘活。作为国际级人工智能新型科研机构,上海AI实验室采取有组织的科研范式,发挥原创算法及AI软硬件深度互联技术优势,在全国算力互联互通探索中抢先布局、不断突破。

DeepLink方案不仅验证了跨域混训的实用价值,也为行业提供了全新启示。在计算资源有限的场景下,行业依旧可以实现不同性能芯片的灵活组合,无需依赖高算力芯片“扎堆”式部署,有效降低对特定硬件的路径依赖;不同算力集群可通过互联组合形成“合力”,突破单集群性能上限;跨厂商资源更好地兼容与协作,为算力生态的多元繁荣奠定基础。


DeepLink超大规模跨域混训技术快速集成方案

新民晚报记者了解到,目前,上海AI实验室DeepLink开放计算体系已深度集成至联通、电信、商汤、仪电等智算平台,实现“1个平台+N种芯片+X个地域”稳定运行。

原标题:《跨南北、贯东西,支持千公里级跨域混训!上海发布超大规模跨域混训技术方案》

栏目编辑:王蔚 题图来源:上观题图 图片来源:采访对象供图

来源:作者:新民晚报 郜阳

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

可城可野,智在从容!猛士M817 Max+如何重新定义出行自由

道哥说车 浏览 16 09-30

男子收1300万元拆迁款后被控敲诈勒索获刑 终审无罪

极目新闻 浏览 9 10-13

九三阅兵以新型四代装备为主 含新型坦克、歼击机等

南方都市报 浏览 5218 08-21

鹿晗账号半年后解封,关晓彤3个细节被扒:太甜了

如安青何 浏览 8723 07-07

轰6k模拟台岛以东发射多枚导弹

央视新闻客户端 浏览 4704 04-03

小吊梨汤“乘势而上”:借力淘宝闪购平台消费券,快速实现经营结果新突破

北京商报 浏览 9782 07-19

年销量仅完成33%,新能源占比不足1/3,长城汽车连续5年未达目标

野马财经 浏览 6 01-08

吉利银河 A7 混动家轿 8 月 8 日全球上市,预售价 9.78 万元起

IT之家 浏览 5095 07-25

《花少7》齐聚非洲,张晚意靠边站,马思纯太美,c位无人敢争

温柔娱公子 浏览 4424 07-04

3500点之上,A股的增量资金会从哪里来?

郭施亮 浏览 454 07-18

71岁成龙现身!从5块钱龙套到奥斯卡,他用伤痕换200亿票房

娱乐白名单 浏览 8347 07-26

已攻入24球,广西恒宸费尔南多打破中乙球员单赛季进球纪录

懂球帝 浏览 10 10-21

GPT-5 Pro独立做数学研究,OpenAI总裁:这是生命迹象

量子位 浏览 14 08-22

马德兴:汪士钦落选是因为熊猫杯引发舆情,于金永身体不适

懂球帝 浏览 9 12-05

美媒称普京呼吁伊朗接受"零浓缩铀" 俄方批驳:假新闻

新京报 浏览 5930 07-14

开播冲上9.2分,这神剧又赢麻了

独立鱼 浏览 2882 08-18

终于可以休息!恩佐更新社媒,晒出度假照片

直播吧 浏览 1618 07-18

黄金价格回调ETF热度不减 不同跟踪标的下黄金ETF涨跌区别在哪儿?

金证研 浏览 10 10-31

机器人“农民”来了!智能“秒杀”杂草,不用一滴农药

上观新闻 浏览 6 01-15

出海墨西哥,多少中国企业被割成韭菜

快刀财经 浏览 2431 07-24

媒体:安世中国第3次硬核回击荷兰 已获国家强势撑腰

看看新闻Knews 浏览 14 11-03
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2