云霞资讯网

特斯拉Dojo3:一场跨越七年的算力博弈,从激进自研到务实融合

从2019年首次曝光到2026年重启迭代,特斯拉Dojo项目的七年历程可谓是跌宕起伏。作为特斯拉冲击AI算力自主权的核心

从2019年首次曝光到2026年重启迭代,特斯拉Dojo项目的七年历程可谓是跌宕起伏。作为特斯拉冲击AI算力自主权的核心载体,它的每一次转向都折射出科技巨头在技术理想与商业现实间的艰难平衡。

2019年4月,特斯拉Autonomy Day上,Dojo项目首次进入公众视野。马斯克彼时的核心诉求直白而激进:摆脱对英伟达等外部供应商的依赖,为FSD(特斯拉完全自动驾驶系统)打造专属算力平台。当时特斯拉已拥有百万级联网车辆,每日产生海量驾驶视频数据,通用GPU的成本与效率瓶颈日益凸显。马斯克直言,若能获得充足的外部算力支持,或许无需Dojo,但垂直整合的执念让他选择了最难的路,从零构建专为计算机视觉训练优化的全栈计算系统。这一年,马斯克多次渲染Dojo的“猛兽级”性能,称其能让自动驾驶安全性提升10倍以上,预计一年后推出首版。

2021年成为Dojo的正式落地元年。8月首届AI Day上,特斯拉官宣项目细节,推出自研D1芯片,计划与英伟达GPU协同赋能,并展示了首台Dojo机柜及2.2兆瓦负载测试。按规划,单块“瓦片”含25颗D1芯片,目标2023年Q1完成首个Exapod群集,在帕洛阿尔托部署7个集群。2022年AI Day进一步公布扩展蓝图,特斯拉承诺2024年前投入超10亿美元,纽约州布法罗市的Dojo计算中心也于2024年1月获得5亿美元投资。此时的Dojo承载着资本的极高期待,摩根士丹利曾预测其若成功落地,可为特斯拉增加5000亿美元市值。

然而,激进的技术路线很快遭遇现实阻力。D1芯片采用7nm制程,单颗研发成本超1.2亿美元,远超同类产品;其独创的计算架构虽针对视觉训练优化,但兼容性不足,陷入“偏科”困境,难以适配后续更复杂的大模型需求。更关键的是,英伟达CUDA生态的壁垒难以突破,开发者更倾向于成熟的通用GPU平台,Dojo的封闭软件栈推广艰难。截至2024年,已投入运行的Dojo集群算力仅相当于7500块H100 GPU,仅为特斯拉同期采购英伟达芯片算力的四分之一,从未成为FSD训练的主力。

2025年,Dojo迎来重大转折。8月,特斯拉突然暂停项目,解散核心团队,项目负责人彼得·班农离职,约20名核心成员跳槽至初创公司DensityAI。马斯克将此次调整解释为摆脱“进化死胡同”,宣称Dojo 2的技术路线已不适应发展需求,未来将聚焦AI6“融合架构”芯片。这一决策背后,既有技术路线的碰壁,也有财务压力的考量。当时特斯拉电动车业务收入同比下降16%,而Dojo持续投入却回报甚微,放弃独立自研路线可节省超20亿美元研发费用。此后,特斯拉转向外部合作,三星获得AI6芯片独家代工订单,现有Dojo集群逐步替换为英伟达H200 GPU集群。

2026年1月,随着AI5芯片设计完成,马斯克宣布重启Dojo3项目,但此时的Dojo已非昔日模样。新方案彻底抛弃D1芯片的独立路线,采用“单块电路板集成大量AI5/AI6芯片”的模块化架构,通过简化布线降低成本与复杂度。AI5芯片性能达2000—2500TOPS,是HW4芯片的5倍,支持车端与机器人共享算法;AI6芯片则主打“训推一体”,兼顾端侧推理与云端训练。值得注意的是,Dojo3已纳入AI系列芯片生态,不再是独立项目,马斯克甚至透露后续AI7芯片可能用于太空算力部署,延续Dojo的算力探索逻辑。

从2019年的“摆脱依赖”到2026年的“融合协同”,Dojo项目的七年演变,本质是特斯拉AI战略从理想主义向务实主义的回归。它证明了专属算力平台的技术价值,也暴露了纯自研模式的高风险,在成熟生态壁垒与快速迭代的技术浪潮下,孤注一掷的激进路线难以持续。如今的Dojo3,既是对前期技术积累的继承,也是对市场规律的妥协,其未来能否真正突破算力瓶颈,仍需在实际应用中接受检验。