云霞资讯网

多家媒体发文点赞,三年自研,国产化国产网络这次真成了

0.9微秒端到端时延,260纳秒交换机转发延迟,11.4万卡单子网规模,成本降低30%。 看第一财经、环球网、新华网都在点赞中科曙光,再细看下这组数字,确实够硬。“填补空白”这种词,媒体不轻易用。但这次,确实到了该用的时候。

看几个数字就明白了:端到端通信时延0.9微秒,交换机转发延时260纳秒。单子网互连规模是传统InfiniBand的2.33倍,可支持11.4万卡集群部署。网络总成本降低30%。

为什么这些数字重要?邬贺铨院士点出了本质:大模型训练对网络的要求是超低延迟、超高带宽、全程无损。传统以太网改装的RoCE方案,需要大量调优才能勉强维持无损;而InfiniBand架构是原生的无损网络,全球约60%的高性能计算系统都在用。 但问题是,InfiniBand市场被NV一家独大,国内用户面临成本高昂、供货受限的困境。

曙光的解法很直接:从底层的112G SerDes IP,到交换芯片、网卡、交换机、管理软件,全部自己干。三年时间,把最难的那层窗户纸捅破了。

中国信通院郑立说得好:传统RDMA实现路径存在生态封闭或性能短板,倒逼行业走向融合与自研。今天之后,国产算力从“能用”走向“好用”,有了最关键的底牌。