DeepSeek三个月,改变全球四大云厂走了三年的路

周子涵说科技 3天前 阅读数 7 #推荐

在当今科技领域,AI的发展犹如一场永不停歇的风暴,时刻搅动着行业的格局。而最近,中国的大模型创业公司DeepSeek和中国AI应用创业公司Manus就如同两颗重磅炸弹,在过去三个月里引爆了市场情绪,给全球AI产业带来了前所未有的冲击,也促使亚马逊、微软、谷歌、阿里等科技巨头重新审视自己的战略布局。

时间回溯到不久前,在中国这片充满创新活力的土地上,DeepSeek和Manus犹如两颗新星开始崭露头角。DeepSeek宣称,他们利用2048张英伟达H800芯片,耗费558万美元的训练成本,成功训练出了DeepSeek - V3模型。这一成果令人瞩目,因为该模型的性能与美国明星AI创业公司OpenAI旗下的主力模型GPT - 4o相近。这一消息如同在平静的湖面上投下了一颗巨石,瞬间在AI界激起千层浪。

与此同时,Manus也不甘示弱。它借助Muti - Agent(多代理)策略,打造出了一款AI原生应用。从其演示资料来看,Manus仿佛拥有了人类的智慧,能够独立思考、计划并执行复杂任务。要知道,Muti - Agent可是被业界认为是2025年AI应用的发展方向,Manus的出现无疑是走在了时代的前沿。

然而,这两家公司的崛起并非一帆风顺。DeepSeek虽然成果斐然,但市场对它披露的算力规模和训练成本产生了质疑。毕竟如此大规模的投入和产出是否合理,很多人都持有怀疑态度。而Manus则被一些人认为是“套壳”产品,缺乏真正核心的竞争壁垒。尽管存在争议,但不可否认的是,它们都是大模型浪潮三年发展历程中的重要里程碑。

在这三个月里,DeepSeek和Manus掀起的狂潮对全球AI产业产生了深远的影响,尤其是对于那些拥有云业务的大型科技公司而言,它们的既定路线正在被改写。

过去三年,大模型竞争的核心在于训练环节。各大公司都在比拼谁能用更多的算力资源训练出更强大的模型,万卡、十万卡的训练规模屡见不鲜。但近一年来,情况发生了变化。“Scaling law”(规模定律,即模型性能由算力、模型、数据规模决定)的增速开始放缓,成倍的算力投入只能换来模型性能10% - 20%的提升。不过,随着芯片、模型和算法的不断优化,推理算力成本正以每年十倍的速度下降。

与此同时,过去三年一直处于萌芽期的AI应用,在这三个月里迎来了快速成长的契机。AI应用主要消耗推理算力,而云厂商则是这一过程中的受益者。以前,AI应用落地的主要障碍就是推理算力成本偏高。但现在,随着推理算力的下降,像钉钉、飞书、WPS、美图秀秀这些老牌应用在近三个月纷纷加快叠加新的AI能力,Manus这类AI Agent为代表的原生AI应用也如雨后春笋般迅速爆发。

在这场由DeepSeek和Manus引发的变革浪潮中,全球四大云厂商——亚马逊、微软、谷歌、阿里又是如何应对的呢?

首先是亚马逊,它在这场变局中可谓是反应迅速且态度坚决。作为全球率先接入DeepSeek的云厂商,亚马逊的一系列动作可谓是一气呵成。1月30日,亚马逊云科技Marketplace模型市场和SageMaker开发平台接入DeepSeek。这一举措为后续的发展奠定了基础。2月24日,亚马逊云科技Marketplace中国区上线硅基流动(一家部署了DeepSeek V3/R1的平台服务商),使得中国用户也能够借助这一平台使用DeepSeek。3月11日,亚马逊在Amazon Bedrock平台上架DeepSeek - R1,这可是中国市场首款上架Bedrock的大模型。而且,亚马逊云科技成为了首个提供全托管版本并正式商用的海外云厂商。

要知道,入选Bedrock的门槛是相当高的。亚马逊会对全球范围内的大模型进行严格评估和筛选,目前Bedrock只有十家模型厂商的产品入围,其中包括明星AI创业公司Anthropic旗下的Claude 3.7系列、Meta旗下的Llama 3系列等。亚马逊之所以如此积极地接入DeepSeek,一方面是因为DeepSeek - R1技术领先,性能出众,吸引了像丰田、思科等大客户的关注;另一方面,亚马逊秉持着“Choice Matters”(选择大于一切)的理念,它希望给开发者提供更多的自主选择权利,让客户在面对不同模型的专业领域时,能够在成本、速度、性能三者之间权衡,找到最适合自身业务的模型。

为了更好地适配DeepSeek,亚马逊云科技还提供了完整的工具集,如Agent、知识库、提示词管理、Guardrails(安全防护)等功能。以DeepSeek - R1为例,虽然它参数规模达到了史无前例的6710亿,但也带来了测试中表现不稳定、高并发等问题,而且其幻觉率偏高,AI创业公司Vectara用幻觉评估模型计算称,DeepSeek - R1幻觉率为14.3%,这是大部分头部模型厂商两年前的水平。不过,Bedrock的Guardrails功能可以提供防护栏,阻止85%的有害内容,并借助自动推理检查防止模型幻觉带来的事实错误。

除了亚马逊,其他科技巨头也在这场变局中有着自己的应对策略。微软和OpenAI拿出了性能更强的o3 - mini和GPT - 4.5,试图在竞争中保持领先地位。而阿里则在春节期间发布了对标DeepSeek - V3的Qwen2.5 - Max。谷歌等厂商也在不到一个月内跟进推出了对标DeepSeek的产品。

面对DeepSeek的技术创新,大厂们的态度各不相同。一些大厂原本认为大模型只是几个大厂的游戏,创业公司很难出头。但DeepSeek的出现打破了这一观念,让大厂技术团队的心态变得矛盾起来。一方面,他们想要学习借鉴DeepSeek的技术特性;另一方面,又不甘心承认它的领先地位,认为自己也能够拿出更好的模型。

在这场激烈的竞争中,亚马逊更关注模型的实际业务表现,如响应速度、吞吐效率、安全可靠等。这也体现了亚马逊一直以来坚持的“Practical AI”(实用/可用的人工智能)观念。亚马逊没有一个研究院性质的组织,而是把AI能力分散在各个业务线,让自家模型经过业务检验,实现“eat your own dog food”(使用自家生产的产品)。例如,Anthropic 2月末推出的Claude 3.7 Sonnet系列推理模型,其工程、代码能力一直远超其他模型。而亚马逊云科技去年12月推出的旗下自研家族模型Amazon Nova,包括四个基础版本(Micro、Lite、Pro、Premier),以及图像模型Nova Canvas、视频模型Nova Reel,主打卖点是便宜、好用、安全,以及多模态。

随着模型加速落地,AI应用爆发,加大算力投入已是大势所趋。这三个月里,关于算力需求的未来走势也曾引发过争论。DeepSeek披露的信息似乎表明,不需要万枚、十万枚高端AI芯片也能做出不错的模型,这引发了市场担忧,甚至导致英伟达股价在1月27日下跌约17%,市值蒸发近6000亿美元。但乐观预期很快占据主流,人们认为单位算力成本下降反而会激发更多需求,AI应用将因此爆发,进而加大算力消耗量。

2月后,中美四家大型科技公司(亚马逊、微软、谷歌、阿里)均公布了2025年资本支出计划,它们并未减少算力投资,反而在加码算力投入。科技公司每年至少60%以上的资本支出被用于投资算力,如采购芯片、服务器、存储和网络设备、租赁土地、建设数据中心等。

2024年,这四家科技公司资本支出均达到历史顶点,2025年仍将高速增长。其中,亚马逊计划2025年投入1000亿美元资本支出,增速接近30%,主要用于云业务;微软计划2025财年资本支出800亿美元,且2025年资本支出将环比增加;谷歌计划在2025年投入750亿美元资本支出,增速将超过40%;阿里宣布,未来三年将投入超过3800亿元(约合535亿美元),用于云和AI硬件基础设施,总额超过去十年总和。

不同公司面临的资本支出压力也不尽相同。亚马逊的资本支出率偏低,对未来几年的利润影响有限,算力投资相对可持续;而微软的资本支出率偏高,对利润的影响相对更大。

尽管面临种种不确定因素,亚马逊、微软、谷歌、阿里仍要加大算力投入。一方面,它们的财务状况能够支撑短期高强度算力投资;另一方面,短期砸钱买算力对利润影响不大,还能通过延长部分服务器、网络设备使用时长调节利润。而且,过去两年的巨额投资已经产生了实际回报,“云 + AI”收入、利润在增长,这进一步刺激了算力投资。

在这场由DeepSeek和Manus引发的AI变局中,科技巨头们都在积极应对,试图在这场变革中找到自己的位置,实现新的突破和发展。而这场变局也让我们看到了AI领域的无限潜力和可能性,未来究竟谁能在这场激烈的竞争中脱颖而出,让我们拭目以待。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

周子涵说科技

周子涵说科技

周子涵说科技