云霞资讯网

谷歌与Meta达成数十亿美元AI芯片协议,与英伟达竞争加剧

据一名参与谈判的消息人士透露,MetaPlatforms已签署协议,租用谷歌的AI芯片——张量处理单元(TPU),用于开发新的AI模型。另一位获悉相关情况的人士称,这份多年期协议价值数十亿美元。Meta还与谷歌商谈最早于明年为自家数据中心采购TPU,不过相关讨论的进展尚不得而知。

这笔交易对谷歌而言是一次胜利,使其再添一家知名客户,有望助力其打造规模达数十亿美元的TPU销售业务。与此同时,这对英伟达构成了威胁——英伟达目前主导AI芯片市场,也是Meta训练AI模型所用图形处理器(GPU)的主要供应商。

据参与相关安排的消息人士透露,除与Meta达成合作外,谷歌还与一家未具名的大型投资机构签署协议,为一家合资公司提供资金,由该合资公司向其他客户出租TPU。谷歌正与其他投资机构洽谈,为更多同类合资公司融资。

核心要点

谷歌加速推进TPU销售,挑战英伟达的市场主导地位

谷歌成立合资公司,向AI客户出租TPU

谷歌与Meta仍是英伟达AI芯片的最大买家之一

上述两项举措表明,谷歌正加速在AI芯片业务上与英伟达直接竞争,包括英伟达占据主导的AI训练市场。谷歌有望通过销售TPU获得数十亿美元的额外收入。

谷歌与Meta达成交易的消息公布前几天,英伟达刚宣布与Meta达成新协议:Meta表示未来数年将为数据中心采购数百万片英伟达GPU。当时,这份英伟达协议曾引发外界对谷歌与Meta谈判前景的质疑(《信息》去年曾率先报道相关谈判),但目前尚不清楚该协议是否产生了影响。Meta决定采用TPU的另一个原因,可能是其自研AI训练芯片进展不顺,《信息》周四早些时候已披露相关细节。

据一位听闻相关内部讨论的人士称,谷歌云部门部分负责人此前曾在内部表示,大力发展TPU业务有望帮助谷歌抢走英伟达年收入的10%——过去12个月英伟达营收约为2000亿美元。

一位参与谷歌TPU战略的人士表示,谷歌正在探索多种方式让客户用上TPU。两名直接知情的消息人士称,正因如此,谷歌正与私募股权投资机构洽谈,计划成立合资公司,由合资公司采购TPU再转租给AI客户。

这些合资公司还可自建云业务,负责运营TPU。英伟达也曾采取类似策略为芯片培育客户,包括投资一批专注于向AI客户出租GPU的新兴云服务商(新云厂商)。

其中一位消息人士称,谷歌已就此与至少一家大型投资机构签署了条款清单。谷歌云资深高管本杰明・特雷纳・斯洛斯带领的一个小组正牵头推进TPU融资项目,并与云业务主管托马斯・库里安密切合作。

据参与相关洽谈的人士透露,谷歌企业发展团队也在与潜在融资伙伴会面,为特殊目的实体(SPV)融资,用于采购TPU并转租给客户。这种模式与埃隆・马斯克的xAI通过风投机构Valor进行创新融资、获取英伟达GPU的结构类似。消息人士称,在谷歌洽谈的此类交易中,TPU可作为债务抵押物。

平衡之道

对谷歌而言,管理TPU业务的增长是一项棘手的平衡术。这家科技巨头虽在加紧与英伟达竞争,但其谷歌云部门同时也是英伟达GPU的最大买家之一——因为多数AI开发者客户需要GPU来开发技术,谷歌云无法不提供搭载英伟达芯片的服务器。谷歌必须持续获得英伟达最新芯片,才能在云市场保持竞争力。

此外,面向新客户的TPU供应量仍是未知数。负责开发Gemini聊天机器人及相关模型的谷歌AI团队自身也在使用TPU,必须确保有充足产能以与OpenAI等对手竞争。台积电同时生产谷歌TPU和英伟达GPU,意味着二者实际上在争夺晶圆厂产能。

多年来,谷歌一直向云客户出租在谷歌云数据中心运行的TPU,但从去年开始,谷歌向包括Meta和大型金融机构在内的部分客户推广在客户自有数据中心使用TPU的方案。

谷歌的推广方式之一是强调TPU的成本优势,称其使用成本高于昂贵的英伟达芯片。英伟达高端芯片的高昂价格,也让甲骨文等其他云服务商难以通过出租英伟达芯片获得可观毛利率。

英伟达CEO黄仁勋并非不清楚:全球顶尖的两款AI模型(谷歌和Anthropic的产品)全部或部分使用谷歌AI服务器芯片而非英伟达GPU训练而成。

谷歌发力TPU之前,包括OpenAI和Meta在内的部分云厂商及客户去年就曾遇到问题:难以按预期规模部署英伟达最新的布莱克韦尔(Blackwell)AI芯片,部分原因是硬件存在技术故障和其他复杂性。

长期以来,为自家数据中心直接采购AI芯片的Meta等公司一直在寻找英伟达的替代品,以免受制于单一供应商。据参与交易谈判的人士称,Meta本周还宣布与英伟达另一个竞争对手超威半导体(AMD)达成大额AI芯片采购协议,不过这些芯片将主要用于运行现有AI模型(推理),而非训练新模型。

事实上,Meta计划使用TPU进行AI训练这一点值得关注——因为多数分析师认为,在训练领域从技术上挑战英伟达难度极大,挑战英伟达的最大机会在于推理环节,而推理不需要大规模互联的服务器集群。

Meta也在继续自研AI推理芯片,以降低成本、摆脱对英伟达芯片的依赖。

Meta并非谷歌TPU的第一个大客户。去年,Anthropic同意斥资约200亿美元从博通采购TPU(博通与谷歌联合设计芯片,并监督台积电的生产)。据与Anthropic高管有过交流的人士透露,Anthropic计划在非谷歌运营的数据中心使用这些芯片。

TPU训练的AI模型

多年来,Anthropic一直使用TPU开发和运行其ClaudeAI,谷歌也已向这家初创公司投资数十亿美元。《信息》去年夏天报道称,谷歌正与OpenAI洽谈TPU合作;11月又报道了Meta与谷歌之间的TPU谈判。

与此同时,英伟达CEO黄仁勋十分清楚:谷歌和Anthropic旗下两款全球顶尖AI模型,全部或部分使用谷歌自研AI服务器芯片而非英伟达GPU训练完成。

他密切关注谷歌在TPU上的技术进展,并已采取行动,吸引现有及潜在TPU客户大规模采购英伟达GPU。Meta与英伟达近期宣布达成新合作;去年,英伟达对Anthropic进行了投资,并获得其芯片使用承诺。《信息》还报道称,英伟达曾讨论向OpenAI进行300亿美元的股权投资。

这些举措表明,黄仁勋与英伟达正在阻击谷歌扩大AI芯片市场份额的努力。

英伟达对AI服务器芯片市场的主导地位,使其成为全球市值最高的公司,市值达4.8万亿美元。其对市场的掌控也推动收入飙升、现金流大增,进而可以用来投资OpenAI、Anthropic等客户,以及CoreWeave等出租GPU的云服务商。