关闭广告

观察|国产算力从单点突破转向系统级创新,厂商齐推超节点,“光”迎来了高光时刻

澎湃新闻2025-07-30 00:00:028740人阅读

7月26日-28日,全球顶级的AI大会世界人工智能大会(WAIC 2025)在上海召开,为全球产业变革提供关键技术支点与战略前瞻洞察。作为人工智能产业链重要一环,本届WAIC也聚集了本土一众算力芯片厂商,其中,华为384超节点真机首次线下亮相引发了广泛的关注。此外,摩尔线程、沐曦、燧原、曦智科技等都展出了自己最新的产品和解决方案。

澎湃新闻记者观察到,在算力芯片制程受限的情况下,产业界转向超节点集群以及产业链多个环节协同创新方式来解决当下算力需求。特别值得一提的是,算力前沿领域的光互联光交换技术也取得了一系列突破性进展。


2025年7月26日,上海世博展览馆,华为昇腾超节点技术突破384卡高速互联,通信带宽提升15倍,使千亿级模型性能提升2.5倍以上。澎湃新闻记者 朱伟辉 图

厂商齐推超节点推动算力进入“万卡协同”时代

本次大会,华为首次把384超节点真机搬到展台,从而引发了观众广泛关注。

华为超节点首创将384颗昇腾NPU和192颗鲲鹏CPU通过全新高速网络MatrixLink全对等互联,形成一台超级“AI服务器”,算力规模300 PFlops,成功打破跨机通信带宽性能瓶颈,实现从服务器级到矩阵级的资源供给模式转变。

此外,华为云的昇腾AI云服务,让超节点能够以云服务的形态实现按需用、随心用,降低企业应用先进智算基础设施的门槛,目前基于CloudMatrix 384超节点的华为云新一代昇腾AI云服务目前已在芜湖、贵安、乌兰察布、和林格尔数据中心全面上线。

万亿参数大模型与多模态训练的崛起,正推动算力集群迈入“万卡协同”时代。超节点架构通过深度整合GPU资源,在超节点内构建起低延迟、高带宽的统一算力实体,已成为支撑这一演进的关键技术路径。

一位芯片行业人士接受澎湃新闻记者采访时表示,之前英伟达推出了NVL 72方案,专注为万亿参数大模型提供训练算力,这也是行业的共识,大家都会走超节点集群路线。此外,本土芯片制程受限,单芯片突破比较难,超节点把更多卡放在一起,从而满足高参数大模型训练需求。

同样的,摩尔线程在WAIC上首次提出“AI工厂”理念,从单芯片转向系统级创新来突破大模型训练效率瓶颈。

摩尔线程提出的“AI工厂”,如同芯片晶圆厂的制程升级,是一个系统性、全方位的变革,需要实现从底层芯片架构创新、到集群整体架构的优化,再到软件算法调优和资源调度系统的全面升级。这种全方位的基础设施变革,将推动AI训练从千卡级向万卡级乃至十万卡级规模演进,以系统级工程实现生产力和创新效率的飞跃。

“光”迎来了高光时刻

本届WAIC,曦智科技联合壁仞科技、中兴通讯共同推出的光跃LightSphere X——全球首个分布式光互连光交换GPU超节点解决方案,凭借其突破性原始创新获得了大会2025 SAIL奖(卓越人工智能引领者奖)。


需要指出的是这是一个真实落地的算力方案,即将落地在上海仪电的国产算力集群。

曦智科技的“全光”方案为厂商部署超节点方案提供了新思路。大型计算集群成千上万颗GPU一起协同工作,连接他们的“神经”——传统的电缆在长距离传输高带宽信号时,会产生巨大的延迟和功耗,这限制了集群的规模和效率。

这时,人们目光锁定了“光”,光带宽更高、延迟更低、能耗也更小。英伟达在交换机上率先引入了CPO(光电共封装)技术,把光模块和交换芯片封装在一起,缩短了电信号的传输距离,从而降低了衰减和功耗。曦智科技也是一家追“光”者,专注于“光子计算+光子网络”两大领域。

该超节点的核心技术就是曦智科技全球首创的分布式光交换技术。传统的方式无论电交换还是光交换都是中央集中式交换,而LightSphere X分布式交换可以理解为把集中式打成碎片,让每个GPU上集成光交换功能。这让超节点在调度GPU时变得非常灵活,而且可以实现故障场景下替换替补,降低GPU冗余成本。

更关键的是,这种交换方式发生在物理层,与上层的数据传输协议无关。这也使得国内各大GPU厂商都愿意跟曦智科技合作一起来构建解决方案。

除了分布式超节点方案,曦智科技还联合燧原科技推出国内首款xPU-CPO光电共封装原型系统,通过将光学引擎与计算芯片(xPU)在基板上实现光电共封装,大幅提升信号完整性并降低损耗和延迟,同时显著降低系统功耗,有效提高光电转换的稳定性。


国内首款xPU-CPO光电共封装原型系统

作为国内首次采用CPO技术实现GPU直接出光的成功案例,该项目验证了xPU-CPO光电共封装技术的可行性与技术方向,同时为中国人工智能基础设施建设与先进光学封装产业突破奠定了关键技术锚点。

曦智科技还与沐曦合作的光互连电交换超节点方案也首次公开亮相。该方案采用线性直驱光互连技术,具有低延时、高带宽、低功耗的特点,并支持长距离传输,突破跨机柜连接的限制,支持8台标准服务器共64张xPU卡的高速互连,为大模型训练及推理提供更灵活、更高效的并行策略支持,从而提升集群性能。

曦智科技创始人、CEO沈亦晨表示:“我们的芯片制程上不一样,我们没有办法继续去复制美国的技术路线,但我们在互联上会催生革命性的’交通工具’。光互联是轨道交通,电互联是公路交通。”

“我们在硅光技术上不落后,甚至我们商业落地比美国企业还要领先些。”沈亦晨表示,未来可能每个交换芯片、GPU芯片都会配数个硅光芯片,类似现在GPU边上配了一圈HBM,整个硅光的生态产业链都会受益,包括晶圆厂、光的封装厂,激光的光源,激光芯片公司等。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普称将会见泽连斯基 讨论防空与远程导弹援助等

新京报 浏览 10 10-14

90%的名酒在跌价,2026年酒企怎么活?

首席商业评论 浏览 8 01-15

谁在买尊界S800?

Daily每日财报 浏览 2947 07-26

一张液化石油气经营许可证申请九年未果 当事人发声

红星新闻 浏览 15 08-22

媒体人:体育局表示王奕博需球队先盖章他们再研究 或赶不上注册

直播吧 浏览 8296 08-13

佩斯科夫:三天停火已结束 未看到乌方停火举措

界面新闻 浏览 3239 05-11

季前赛-凯尔特人18分大胜灰熊 布朗半场21分怀特16+10

醉卧浮生 浏览 14 10-09

重庆潼南:“建圈延链”发展汽车后市场产业

新华社 浏览 1388 08-10

白宫争吵后特朗普与泽连斯基"首度"碰面

央视新闻客户端 浏览 8535 04-27

朱珠美上热搜的老钱风穿搭,太值得借鉴了!

LinkFashion 浏览 17 01-11

饿了么前CEO巨贪案:供应链管理失能

虎嗅APP 浏览 5114 07-27

环球小姐赛事双东家被签发逮捕令

土澳的故事 浏览 6 11-27

读懂IPO|为何能从停产中绝处逢生?五大维度解构广合科技财务水平

时代周报 浏览 4510 07-19

伯利再挖布莱顿,邮报:前布莱顿技术总监威尔加盟斯特拉斯堡

懂球帝 浏览 13 11-01

险企投资收益波动加大 业绩分化利润水平提升

证券市场周刊 浏览 14 10-11

陈冲母女合体拍杂志被嘲,网友抗拒女儿出道

萌神木木 浏览 10 09-18

出门问问2025中期业绩:总收入178.9百万元,亏损收窄99.5%

网易科技报道 浏览 11 08-22

银河M9亮相 吉利"9系"SUV三剑客凑齐

网易汽车 浏览 5478 05-23

美国务院批准对乌新军售

环球网资讯 浏览 12 08-30

名嘴:比尔在快船是角色球员 不明白为什么大家说他会开心

直播吧 浏览 742 07-27

万斯和五角大楼挑明:欧洲 你来为乌克兰安全保障掏钱

澎湃新闻 浏览 12 08-23
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2