关闭广告

全球首次!上海AI实验室实现千里算力互联训练千亿模型,降低“卡脖子”风险

上观新闻2025-07-20 12:00:013049人阅读



上海人工智能实验室于7月19日发布了一项具有里程碑意义的成果,其研发的DeepLink超大规模跨域混训技术方案,成功应用于中国联通网络,将相隔1500公里的两个异构智算中心“拼成”一个“超级节点”,并完成千亿参数的AI大模型训练。此举在全球首次实现长距离跨域异构智能算力的高效整合,不仅可化解全国算力资源分布不均、利用率不高的瓶颈,更可降低AI行业对特定芯片的依赖,一旦出现供应链波动,将为AI产业提供重要的兜底算力支持,避免被“卡脖子”。


据上海AI实验室介绍,今年2月,他们联合十余家合作伙伴,在上海建成了超大规模跨域混训集群的原型,实现了千亿参数大模型20天不间断训练。在此基础上,他们融合中国联通AINET算力智联网,跨越1500公里,连接了上海和济南之间的智算中心,完成了千亿参数大模型混训。

所谓“跨域混训”,就是将位于不同地域、使用不同芯片架构(即“异构”)的多个算力集群互联起来,“拧成一股绳”用于训练;与之相对的是“单集群+单芯片”训练。对AI大模型训练而言,“跨域+异构”的组合,看起来可以带来“1+1”的算力资源,但效果上却远小于“2”,甚至可能为“0”。此前,国内外尚无利用“跨域+异构”算力集群完成生产级模型训练的先例,原因在于互联技术障碍难以跨越,导致模型混训效率低下,难以为继。此次,上海AI实验室成功实现“零的突破”。实测数据显示,其与中国联通合作开展的跨域混训,等效算力高达单集群单芯片算力的95%以上。

过去几年,顺应AI大模型的爆发,国内算力建设如火如荼,但同时也存在区域算力资源分布和使用不均衡的情况,比如在西部一些地区,因为存在综合成本优势,超前部署了不少算力集群,但因为需求波动和运营问题,算力资源的实际使用率并不高,出现了一定程度的算力闲置。同时,随着AI芯片的快速迭代,以及国产芯片的百花齐放,各个智算中心使用的硬件架构也多有不同。由此,利用创新的标准和技术,整合和盘活跨域异构算力资源,变得越来越有战略价值。


上海AI实验室青年科学家、DeepLink系统团队负责人王辉告诉记者,DeepLink方案创新性地采用“3D+PS”的高内聚低耦合架构,某种意义上可以说是“以算法换带宽”。它将超大规模训练任务分发到远隔千里的各个智算中心,通过算法创新,有效减轻了对网络的压力;用户只需使用普通专线网络,就可开展大模型训练。此外,该方案还能确保在跨域训练中,即使某地智算节点发生故障,整体训练也能继续,显著提升了稳定性。

实际上,除了中国联通,上海AI实验室还与中国电信、商汤、仪电等智算平台进行了合作。其中,基于中国电信息壤算网,在不到10G带宽的网络条件下,实现了北京、上海、贵州三地智算中心的互联和大模型混训,等效算力依然在90%以上。王辉表示,理论上,DeepLink可通过动态配置支持数千公里的跨域混训,这意味着,国内任意两地的智算中心都可借助该方案实现算力整合。

中国联通研究院下一代互联网数据中心网络团队经理徐博华告诉记者,中国联通建设高通量、高性能、高智能的算力智联网AINET,研发了长距无损协议及硬件架构;DeepLink则在算法和软件层面实现一系列首创成果。这次“双向奔赴”的合作,为全国算力资源的高效利用带来许多想象空间。比如,它可将多地“碎片化”的算力捏合在一起,化零为整,变成高价值的资源。着眼将来,一旦规模达到目前10倍乃至更大的AI模型出现,对算力提出新的革命性需求,该方案也有可能让用户不必花天价新建超大型智算中心,而是通过将上一代智算中心进行“低成本组合”,满足训练需求。

上海AI实验室表示,下一步,他们还将进一步通过DeepLink超大规模跨域混训技术方案,组建算力生态,扩大应用范围,推动DeepLink方案能被更多服务商所整合,从而让用户可以像逛超市那样,在全国自由选择高质量、高性价比的算力供给,为全国算力一体化布局注入核心动能。同时,他们也会面向多元算力在AI大模型混合推理、分布式强化学习等需求,进一步完善技术方案。

原标题:《全球首次!上海AI实验室实现千里算力互联训练千亿模型,降低“卡脖子”风险》

栏目主编:任荃

来源:作者:文汇报 张懿

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

TVB颁奖礼红毯老龄化严重!50岁佘诗曼压轴,黄宗泽老到认不出

萌神木木 浏览 10 01-05

快讯|智联招聘上线腾讯“附近的工作”

网易科技报道 浏览 16 08-22

滴滴跑出了什么新故事?

虎嗅APP 浏览 16 09-01

全新宝马X5领衔 宝马2026巴黎车展阵容公布

车质网 浏览 10 02-04

FIBA官方晒程帅澎海报!回国后三分12中9被赞核心 记者盼状态延续

颜小白的篮球梦 浏览 3793 07-28

成都农商行换帅!“75后”掌门人来自成都银行

21金融圈 浏览 8274 08-19

男子带1650个苹果到烈士陵园:想让每名烈士都能吃5个

极目新闻 浏览 15 10-26

加长7座实锤?曝特斯拉Model Y+或5月国产,加2座贵1万6你买吗?

念寒车评 浏览 4684 05-06

台媒:大陆在朱日和基地复制"总统府" 不可掉以轻心

经济观察报 浏览 15 01-13

助理曝光杨少华晚年生活:早餐吃海参 天天下馆子

史行途 浏览 3990 07-16

文章疑和姚笛现身上海,真旧情难忘?

暮云晨记 浏览 3780 08-13

啤酒疯起来,比奶茶还甜

斑马消费 浏览 9369 07-17

科技大佬话AI未来:手机消失、工作消失、全民富有?

帮宁工作室 浏览 8 01-08

泽连斯基:部署欧洲伙伴安全队伍谈判已获实质进展

齐鲁壹点 浏览 3232 04-06

股价“闪崩”、市值蒸发500亿,寒武纪怎么了?

征探财经 浏览 10 02-05

寒武纪85后创始人,身家超1500亿

澎湃新闻 浏览 12 08-26

福建小伙靠数千套魔法装备,做出大生意,边玩边赚钱

电商在线 浏览 4134 07-21

OpenAI拟出售约60亿美元股权

第一财经资讯 浏览 2719 08-18

外媒:特朗普转变态度 拒绝普京帮调解伊以冲突的提议

环球网资讯 浏览 6956 06-20

李想回应"理想MEGA造型像棺材":设计团队非常伤心

鲁中晨报 浏览 4570 08-20

楼市的天,真的变了!

博闻财经 浏览 8702 08-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2