云霞育儿网

AMD与OpenAI首席执行官山姆・奥特曼共同发布下一代AI芯片

amd周四公布了其下一代ai芯片instinctmi400系列的新细节,该系列芯片将于明年出货。

amd称,mi400芯片可组装成名为helios的完整服务器机架,这使得数千个芯片能够以“机架级”系统的形式连接在一起。

“我们首次将机架的每个部分设计为一个统一系统,”amd首席执行官苏姿丰周四在加利福尼亚州圣何塞的发布活动上表示。

openai首席执行官山姆・奥特曼与苏姿丰一同登台,并表示其公司将使用amd芯片。

“当你第一次告诉我这些规格时,我心想,这不可能,听起来太疯狂了,”奥特曼说,“这将是一件了不起的事情。”

amd的机架级设置将使芯片对用户而言像一个统一系统,这对大多数ai客户(如云服务提供商和开发大型语言模型的公司)至关重要。这些客户需要覆盖整个数据中心并消耗大量电力的“超大规模”ai计算机集群。

“可以将helios视为一个真正像单个大型计算引擎一样运作的机架,”苏姿丰将其与英伟达预计明年发布的verarubin机架进行了对比。

amd的机架级技术还使其最新芯片能够与英伟达的blackwell芯片竞争,后者已配置72个图形处理单元(gpu)。英伟达是amd在开发和部署ai应用的大型数据中心gpu领域的主要且唯一竞争对手。

amd称,作为英伟达的重要客户,openai一直在为其mi400路线图提供反馈。借助mi400芯片和今年的mi355x芯片,amd计划在价格上与竞争对手英伟达展开竞争。该公司一位高管周三对记者表示,由于功耗更低,这些芯片的运行成本将更低,且amd正以“激进”的价格削弱英伟达的市场份额。

到目前为止,英伟达在数据中心gpu市场占据主导地位,部分原因在于它是首家开发出ai开发者所需软件的公司,这些软件可让原本为3d游戏显示图形而设计的芯片发挥作用。在过去十年ai热潮之前,amd专注于在服务器cpu领域与英特尔竞争。

苏姿丰表示,尽管英伟达使用其“专有”cuda软件,amd的mi355x仍可超越英伟达的blackwell芯片。

“这表明我们拥有真正强大的硬件,这是我们一直知道的,但也表明开源软件框架取得了巨大进步,”苏姿丰说。

2025年迄今为止,amd股价持平,这表明华尔街尚未将其视为对英伟达主导地位的重大威胁。

amd数据中心gpu总经理安德鲁・迪克曼(andrewdieckmann)周三表示,amd的ai芯片将在运行成本和购置成本上更低。

“总体而言,我们在价格上有显著优势,再加上我们的性能竞争优势,因此能节省相当可观的两位数百分比成本,”迪克曼说。

未来几年,大型云公司和各国都准备斥资数千亿美元围绕gpu建造新的数据中心集群,以加速前沿ai模型的开发。仅今年,大型科技公司的计划资本支出就包括3000亿美元。

amd预计到2028年ai芯片总市场规模将超过5000亿美元,尽管尚未说明其能占据多少市场份额——据分析师估计,英伟达目前占据超过90%的市场份额。

两家公司都承诺每年发布新的ai芯片,而非每两年一次,这凸显了竞争的激烈程度,以及尖端ai芯片技术对微软、甲骨文和亚马逊等公司的重要性。

苏姿丰称,amd在过去一年收购或投资了25家ai公司,包括今年早些时候收购服务器制造商ztsystems,该公司开发了amd构建机架规模系统所需的技术。

“这些ai系统变得极其复杂,全栈解决方案确实至关重要,”苏姿丰说。

amd当前的销售情况

目前,云服务提供商正在安装的最先进的amdai芯片是其instinctmi355x,该公司称其已于上月开始批量出货。amd表示,从第三季度开始,云服务提供商将可租用该芯片。

为ai构建大型数据中心集群的公司希望有英伟达的替代方案,不仅是为了降低成本和提供灵活性,还为了满足对“推理”(即实际部署聊天机器人(16.720,0.19,1.15%)或生成式ai应用所需的计算能力)日益增长的需求,这比传统服务器应用需要更多的处理能力。

“真正改变的是对推理的需求显著增长,”苏姿丰说。

amd官员周四表示,他们认为其新芯片在推理方面优于英伟达的芯片。这是因为amd的芯片配备了更多高速内存,使更大的ai模型能够在单个gpu上运行。

amd称,mi355x的计算能力是其前身的七倍。这些芯片将能够与英伟达去年年底开始出货的b100和b200芯片竞争。

amd表示,其instinct芯片已被10大ai客户中的7家采用,包括openai、特斯拉、xai和cohere。

amd称,甲骨文计划向其客户提供包含超过13.1万个mi355x芯片的集群。

meta官员周四表示,他们正在使用amd的cpu和gpu集群来运行其llama模型的推理,并计划购买amd的下一代服务器。

微软代表表示,其使用amd芯片为其copilotai功能提供服务。

价格竞争

amd拒绝透露其芯片的成本——它不单独销售芯片,最终用户通常通过戴尔或超微电脑等硬件公司购买——但该公司计划让mi400芯片在价格上竞争。

这家位于圣克拉拉的公司将其gpu与2022年收购pensando获得的cpu和网络芯片搭配,以构建其helios机架。这意味着其ai芯片的更广泛采用也将惠及amd的其他业务。与英伟达的专有nvlink不同,它还使用名为ualink的开源网络技术来紧密集成其机架系统。

amd声称,其mi355x每美元可提供比英伟达芯片多40%的代币(一种ai输出的衡量标准),因为其芯片比竞争对手的功耗更低。

数据中心gpu每颗芯片可能耗资数万美元,云公司通常会大量购买。

amd的ai芯片业务仍远小于英伟达。该公司表示,其2024财年ai销售额为50亿美元,但摩根大通分析师预计该类别今年将增长60%。