云霞育儿网

如履薄冰黄仁勋

当黄仁勋穿着黑色唐装,登上链博会的演讲台前时,他的财富值正在累积。

7月10日,英伟达股价一度较前一交易日上涨3%,达到164美元区间,市值突破了4万亿美元;该市值超过了微软和苹果,位居全球首位。按照黄仁勋所持有的超过8.58亿股资产计算,他的净资产已达到1440亿美元,位列全球第九。

这家科技巨头的市值攀升速度着实惊人,要知道,2023年5月,英伟达的市值才达到1万亿美元的门槛,短短两年,AI浪潮将英伟达推向又一个高峰。

不管去到哪,黄仁勋已经是绝对的主角,他穿的衣服是什么样式,一件件被探究;他说过的话,像鸡汤一样被传播;即使他训斥员工,也被外界解读为“为了提升公司效率”而不得已为之。

众星捧月时,有些东西藏在光芒背后。在时代的巨轮之下,英伟达始终很难避开争论,国际博弈的赤裸、商业市场的寸土必争……这些因素都让黄仁勋必须时刻在多方利益中斡旋,这个支起“4万亿财富”的男人,他的渺小和忧虑很少被提及。

01

H20芯片解禁,英伟达又可以了

H20芯片,是中美之间角力的缩影。

这是一款在2023年底推出的AI加速器,在美国出台了芯片管制措施以后,英伟达专门为中国市场设计了一款性能较弱、但是符合规定的特供产品。

简单来说,这是一个“精准缩水版”的H100。H100是英伟达当时的旗舰AI芯片,采用更先进的Hopper架构,相比A100提升了数倍的计算性能,不过,早在2022年,美国商务部就限制了H100的对华出售。

H20在FP16精度下的理论峰值算力大约为296TFLOPS,相比H100(SXM版)高达2000+TFLOPS,性能约为其六分之一左右,属于明显削弱的版本。

NVIDIAHopperArchitecture-H100SXM

但是,H20的推理功能表现优异,虽然“低算力”,但是“高显存”。由于显存带宽较高,生成token的时间变快,有分析显示,在经过优化设计后,H20在低批量的大语言模型推理里的tokens运算可比H100提升约20%,延迟亦降低约25%。

况且,H20能适配英伟达的CUDA生态,对中国市场里那些专攻自然语言处理、图像识别等领域的AI企业非常够用,相比国产芯片有着明显优势;而且,全行业的算力荒现象非常明显,有也总比没有好。

凭借H20的特殊性能设计,英伟达总算没有在中国市场失去太多。据分析师估算,2024年,H20为英伟达创造的收入超过120亿美元。

不过,今年4月16日,英伟达接到特朗普政府通知,将“未来无限期”对中国和以色列等D:5国家,禁止出口英伟达H20芯片,除非有许可证。这一刀砍下来,让产业链上的相关企业都措手不及,不得不选择别的技术路线或者中断项目研究。

而H20被锁,对英伟达来说损失惨重,2026财年第一财季计提了45亿美元“与H20超额库存和采购义务相关的费用”的损失。在很大程度上,英伟达无法失去中国市场,被禁的这3个月间,黄仁勋做了很多游说工作,希望能让特朗普政府改变主意。

今年7月,黄仁勋第三次访华行程里,爆出好消息,表示美国政府已经批准H20的销售,黄仁勋称这是一个“非常、非常好的消息”。

两个月前,英伟达还曾传出消息,会生产一款更新款的特供AI芯片,它基于最新的BlackWell架构,最终的名字还没定下来,不过定价会在6500至8000美元之间,比H20的价格还低。消息显示,这款新的GPU会被称为6000D或B40,在规格上,也会进行大幅削减。比如采用传统的GDDR7显存,而非HBM高带宽内存,也不会采用台积电的先进封装技术CoWoS。这也意味着,芯片会满足出口要求,也会进一步降低了成本。

英伟达面向中国市场的这一番游击大战,随着H20的解禁,算是暂时平稳落地。

NVIDIACEO黄仁勋宣布推出BlackwellUltra

但是,业绩的起起伏伏见证了企业受芯片管制法案掣肘,及随之而来的巨大影响。

2022财年,英伟达在中国市场的营收是71.11亿美元,占比31.7%,两年后,生成式AI浪潮吹遍国内,英伟达的营收刚刚超过百亿,同期占比也下降到16.9%。在其他地区业绩不断创新高之时,英伟达来自中国的数据中心收入有着显著的下滑趋势。

来访中国的行程,黄仁勋不仅带来了好消息,还一如既往地展示着他无处不在的个人魅力,他抛弃了皮衣,穿上了中国的传统服装、和雷军合影、演讲时说中文……面对这个充满机遇但又有不确定性的市场,黄仁勋展示着他最热情的一面。

02

霸主地位,挑战也更多

毫无疑问,英伟达在AI芯片领域的霸主地位相当强势,其全球市场占有率达到80%。但是,这剩下的20%的玩家中,并非没有诞生新王的机会。毕竟,除了英伟达,没有企业愿意看到如此一家独大的局面。

2025年6月,作为全球最大的AI芯片客户之一,OpenAI开始租用谷歌的TPU芯片为ChatGPT等产品提供算力支持,这是该公司首次“大规模使用非英伟达芯片”。根据报道,OpenAI希望通过谷歌云租用TPU芯片降低推理计算成本。

TPU全称是TensorProcessingUnit(张量处理器),公众对其并不陌生,因为AlphaGo的训练就是依靠多台机器和48颗TPU实现的技术提升。在外界看来,这被视为最接近挑战GPU地位的技术之一。

TensorProcessingUnit

10年前,谷歌就开始研发TPU芯片,并从2017年开始向训练自有AI模型的云客户提供这一服务。

除了OpenAI,苹果也曾租用TPU,2024年,苹果在一篇如何训练AppleIntelligence(苹果智能)基础模型的论文里提及,在TPUv4和TPUv5p集群的硬件上训练了两个基础模型,一个是30亿参数的语言模型,使用2048块TPUv5p训练而成;另一个是基于服务器的大语言模型,使用8192块TPUv4芯片训练。

苹果的这项战略选择,让英伟达当天的股价应声下跌超7%,创下3个月来最大跌幅。

当然,TPU的应用范围远不及GPU广泛,大模型公司的主力AI数据中心还是会选择英伟达,不过,TPU适用于高效地执行特定范围的功能,能耗和成本更低。根据报道,TPU的成本只有英伟达H100、A100芯片的五分之一。

不仅是谷歌,微软、亚马逊等巨头也在自研芯片的道路上埋头苦学,他们跟英伟达一边合作,一边博弈。

除了巨头们的奋发图强,在一个月前的AMDAdvancingAI大会上,英伟达的老对手AMD推出了其史上最强的AI新品组合。CEO苏姿丰告诉到场的观众,MI350系列芯片的最新版本在速度上已优于英伟达的同类产品,较其前代产品也实现了巨大的性能提升。

该旗舰新品还有一个特点,那就是性价比高。有分析表示,MI355X在低批量大模型推理时能实现每美元tokens产出较B200高40%,分析师认为其平均售价可达25000美元,该价格较英伟达产品低约30%。

这些竞争对手虽然还没触及英伟达的护城河,但是AI时代需求迭代极快,企业的登顶与跌落也容易发生在瞬息之间。

前车之鉴并不远。在个人计算机盛行的年代,英特尔凭借在CPU领域的霸主地位傲视群雄,而英伟达是那个半路杀出来的挑战者——它没有主攻CPU,而是看中了图形处理器的潜力,首次提出了将GPU独立出来的构想,并且随着比特币、AI浪潮的到来,登顶高性能计算的顶峰。

NVIDIAGPU计算已为行业开启崭新的道路,到2025年,计算性能将提升至现有水平的1000倍/截图自NVIDIA

现在,英伟达的竞争对手们一如当年骁勇的自己。

2024年,黄仁勋在接受媒体采访时被问道,“英伟达真的没有任何强劲的对手吗?例如在美国有一家由许多科技龙头组成的UXL基金会,他们想建立一个多元供应商、多元架构的生态体系,有人说它的目标是挑战CUDA,你怎么维持英伟达的领先地位?”

“我们是市场创造者,不是市场占有者”,他先是阐释了一番英伟达的历史,然后如此回答道。

03

四万亿之后

如今,环顾AI芯片圈,到处都是华裔的面孔。他们有着东方脸庞,起着一个讲究的中文名,能说上一段中文。不过,他们的本质依然是精明的商人。而黄仁勋频频来华的身影,也展现着他在中美两个市场间的斡旋和努力。

根据外媒报道,在H20芯片禁令出台后,黄仁勋花费了数个月的时间在美国政界各处游说,强调禁令会带来反作用。尽管他表示,“我不认为我改变了他(特朗普)的想法”,但是不难看出,英伟达非常需要中国市场。

黄仁勋表示,NVIDIA在中国的市占率已经从拜登执政初期的95%跌至目前的50%,其主要竞争对手为生产昇腾910B芯片的华为。受H20禁售的影响,英伟达不仅有数十亿美元的库存损失,而且还损失了高达25亿美元的潜在销售额。

而在另一边的中国企业看来,美国朝令夕改的管制措施,充满着不确定性和无奈,一定程度上倒逼着国内自研芯片潮的深入发展。

如果单纯以性能进行对标的话,以H20为例,国产GPU公司已经有多款接近和相似的产品,譬如华为昇腾910C、昆仑芯第三代芯片P800、摩尔线程MTTS80、寒武纪思元590等。

其中,像华为的昇腾(Ascend)就是面向高性能AI计算的自研NPU芯片。DeepSeek的内部基准表明,在特定LLM推理任务上,华为Ascend910C的tokens/s可达H100的约60%。2024年,国内AI芯片的销售市场里,华为昇腾以23%的份额位居第二,其余份额由寒武纪、摩尔线程、沐曦等国内厂商瓜分。

华为昇腾芯片

国产芯片创业公司的订单增加,前景也充满着想象力,并在最近迎来了上市潮。6月30日,摩尔线程和沐曦两家国产GPU企业科创板IPO均获上交所受理,摩尔线程拟募资80亿元,用于芯片研发项目及补充流动资金;沐曦拟募资39.04亿元,投入新型高性能通用GPU等项目研发。

CUDA生态的护城河确实很强大,但黄仁勋的危机感也是显而易见的,他知道H20的禁用不仅是被当作国际博弈的牺牲品,还有可能把一个庞大的市场让出给对手。

在公开场合里,黄仁勋曾经表达他的遗憾:“无论有没有美国芯片,中国的人工智能技术都在快速发展。问题不是中国是否会拥有人工智能,它已经拥有了。真正的问题是,世界上最大的人工智能市场之一是否将运行在美国的平台上。”

英伟达CUDA函式库包含八大函式

而且,特朗普政府政策的反复不定,给美国本土企业带来的忧虑难以抹去。黄仁勋曾经向他的下属表示,作为一个电气工程师出身的人,他认为政府事务不值得花太多心思,但是现在,他前往海湖庄园参加秘密晚宴,承诺与合作伙伴在美国投资5000亿美元……通过这些,他试图为英伟达争取一个全球增长最快的市场。GPU的研发极其烧钱,2014-2023年,英伟达累计投入费用达到364亿美元,高于苹果、微软等科技巨头,没有足够的市场支撑,研发的资金很难长期维系。

站在历史高位的英伟达,耳边总是不乏泡沫的声音。在来到四万亿的关口之后,市场对其的情绪更加狂热,AI能否实现大规模的落地和英伟达的长期竞争力息息相关。据创业资讯网站Crunchbase的数据,2024年全球AI初创企业融资额突破1500亿美元,其中80%获得资金的公司还没实现盈利。知名的做空者吉姆·查诺斯直言:“整个AI生态系统让人联想起2000年互联网泡沫”。

强者如黄仁勋,创造了潮流,却也不能左右它的演进。种种声音围绕身边,让人不禁好奇:时刻准备着战斗的黄仁勋,将被时代带往何处去?