云霞育儿网

华为的“算力核弹”能超越英伟达的原因是什么? 说起AI领域的“顶流”选手,英伟达

华为的“算力核弹”能超越英伟达的原因是什么? 说起AI领域的“顶流”选手,英伟达一直是行业标杆。可谁能想到,华为的CloudMatrix384超节点横空出世,在算力较量中直接超越了这位“老大哥”。 这背后的制胜逻辑,并非单靠某项尖端技术,而是从系统架构到通信技术的全方位创新。 先看实打实的性能数据。CloudMatrix384超节点算力规模达到300PFlops,比英伟达NVL72高出70%,网络和内存总带宽更是分别提升 107% 和 113% 在处理当下热门的MoE模型时,华为超节点的分布式架构让单卡计算与通信效率大幅提升,这意味着在训练复杂AI模型时,它能更高效地调用资源,避免“算力空转”。 更关键的是,华为基于这套超节点系统,成功训练出7180亿参数的盘古UltraMoE模型,打破了“国产算力只能推理、无法训练大模型”的偏见。 华为的底气,很大程度来自对光通信技术的深度应用。相比英伟达NVL72采用的全铜线架构,华为超节点部署了3168根光纤与6912个400G光模块。 光通信虽然成本高、维护难,但胜在传输距离长、带宽大,能支持更多芯片互联。 这就好比在城市交通中,光通信搭建起立体高速路网,而铜线架构还停留在平面主干道,传输效率高下立判。 当然,华为也没让光通信的短板成为阻碍,凭借通信领域多年积累的技术经验,配合昇腾云脑的智能故障处理系统,将光模块的稳定性做到了行业领先。 最核心的突破,还在于架构层面的颠覆式创新。传统计算架构以CPU为中心,数据传输需要层层中转,效率大打折扣。 华为直接打破这一模式,提出“全对等架构”,通过高速互联总线将CPU、NPU、存储等资源全部“拉通”,实现真正的点对点通信。 当然,超大规模的算力堆叠,也带来了功耗难题。CloudMatrix384超节点功耗达到英伟达NVL72的4.1倍,但这并没有成为制约发展的瓶颈。 一方面,中国在清洁能源领域的发展,为高能耗的算力设施提供了底气;另一方面,华为通过液冷散热、智能温控等技术,将数据中心能效比PUE做到1.12,相比行业平均节能70%。 在技术封锁的大背景下,华为的突围路径极具启示意义。它证明了,当单点技术暂时落后时,通过系统级创新、全栈技术协同,同样能在高端领域占据一席之地。