云霞资讯网

云服务需求增长,苹果正与谷歌洽谈由其托管新版Siri

在多年对自有基础设施投入不足之后,苹果可能会进一步加深对谷歌云服务的依赖。

今年1月,苹果宣布将在其产品中使用谷歌Gemini大模型,这相当于承认这家iPhone制造商过去几年在AI领域已无法独立竞争。而这笔交易也暴露了苹果的另一块短板——云计算,并再次选择依靠外部公司来弥补。

如今,苹果有可能进一步加深对谷歌的云依赖。据两位知情人士透露,应苹果要求,谷歌已研究在其数据中心内部部署服务器,用于运行即将推出的新版Siri数字助手。该版Siri将由Gemini驱动,同时遵守苹果的隐私标准。苹果目前已在在线存储、内部AI模型训练等服务上依赖谷歌云。

过去,苹果曾表示,会将用户的复杂AI请求发送至一套名为**私有云计算(PrivateCloudCompute)**的苹果自有系统,该系统运行在搭载苹果定制芯片的服务器上(简单AI请求则在设备端处理)。

多年来,苹果一直立志实现云计算自给自足。公司多位高管曾试图搭建内部基础设施,以减少对谷歌、亚马逊云科技等云服务商的依赖。

但据十几位苹果前高管和工程师称,这些云项目过去屡屡受阻,原因是苹果财务高管将云计算视为令人头疼的成本中心,而非战略重点。他们表示,苹果不愿对自有基础设施大举投入,已导致云领域人才持续流失。

近几年,外界越来越质疑苹果在数据中心投入上远少于同行,苹果则向投资者辩称,其“混合式”基础设施策略——即结合公有云服务与苹果自有基础设施——效果良好。

苹果在云计算上的困境,与其在AI领域的磕磕绊绊并行且高度相关。过去一年,苹果迟迟未能按时推出AI驱动的新版Siri,已上线的AI功能也反响平平。

前员工透露,反映出这种困境的是,苹果私有云计算的平均利用率仅10%。部分用于AI云的服务器甚至仍在仓库里,尚未上架安装。不过,如果苹果宣称今年推出的新版Siri大获成功,其AI算力需求可能会急剧飙升——这也能解释苹果为何与谷歌洽谈托管Siri一事。

苹果在云计算上依赖谷歌,与其一贯坚持掌控产品核心组件的理念形成鲜明反差。苹果以自主设计硬件、软件、芯片等核心部件著称,以此获得产品竞争优势。

与此同时,苹果也以吝啬闻名,尤其在数据中心这类需要巨额前期资本开支的项目上。近年来,Meta、微软、谷歌、亚马逊等公司为适配AI爆发式增长,纷纷投入史上最大规模的数据中心建设,而苹果基本置身事外。

相反,苹果财务高层更倾向于从外部云服务商租用AI算力与服务。诚然,正如OpenAI和Anthropic所证明的,自建数据中心并非成为AI领导者的必要条件。但如果云服务商未来提价,过度依赖外部公司可能会让苹果后悔,届时或将被迫自建更多服务器。

前苹果云工程师认为,更核心的问题在于:苹果文化依然围绕卖设备展开,设备销售占其营收绝大部分。即便音乐、AppStore等服务业务收入不断增长(这些服务要么跑在苹果自有云上,要么租在第三方服务器上),这一点也没有改变。

苹果内部混乱的后端基础设施进一步加剧了困境。公司内部多个部门各自使用独立服务器或不同云服务,与谷歌等大型科技公司统一算力池的模式形成对比。

“苹果和谷歌的工程文化截然不同,”曾参与下一代Siri研发、并于去年12月离职的伊戈尔・纳韦尔纽克说,他此前在谷歌基础设施部门工作超过十年。

“谷歌大部分系统是中心化的,所有人用同一台超算;而在苹果,技术选择是孤岛化的。”

严控成本

苹果的云问题可以追溯到几十年前。

2003年iTunes音乐商店上线后,苹果开始扩大小型数据中心规模,以支撑数字音乐销售的爆发式增长。

随着苹果在线业务扩张,其系统变得杂乱无章。例如,2008年推出的个性化歌单功能iTunesGenius,搭建在与iTunes主体完全独立的技术和服务器上——原因是苹果希望对用户音乐库分析数据做匿名化处理。

大约在同一时期,苹果开始越来越依赖公有云服务。这一当时还很新颖的概念由亚马逊云科技开创,即把大型数据中心租给企业客户。AWS曾是苹果2011年推出的iCloud存储服务的早期在线存储提供商。

但当苹果推出iCloud照片备份功能时,海量iPhone用户拍照带来的公有云存储成本高得难以承受。为省钱,苹果开始自建服务器用于iCloud照片备份。此举还带来意外效果:据一位参与该项目的前苹果高管称,当苹果告知AWS自己的计划后,亚马逊直接将云服务费砍半。苹果此后一直采用自建服务器+云服务商混合模式。

到2013年,苹果财务部门对公有云和自有服务器双双飙升的成本感到不满,开始质问服务团队是否充分利用了公司已有的内部基础设施。

前工程师称,这些团队之间缺乏协调,导致基础设施重复建设、大量算力闲置。例如,iTunes服务器有空闲容量,其他苹果团队却无法使用。

2013年,苹果指派当时的工程总监帕特里克・盖茨,负责将分散的服务器整合成所有团队都能使用的公共资源池。他牵头成立了新部门平台基础设施工程部,效仿亚马逊、谷歌的现代云体系搭建共享算力。

ACDC项目

但盖茨难以推动公司各部门使用这一中心化平台,并于2018年离职。2019年,曾任Twitter工程副总裁、微软云早期负责人的迈克・艾伯特接手剩余团队,继续推进该项目。

艾伯特试图在苹果内部植入更偏云化的文化。2021年,他在内部发起基础设施峰会,鼓励全公司协作共建共享基础设施。

他还推动了多项新计划,最知名的是ACDC项目——将苹果芯片技术用到自有数据中心服务器上。项目全称“Applechipsindatacenter”,初衷是让运行苹果在线服务的数据中心,达到与设备端同样严格的隐私标准。

据《TheInformation》此前报道,他还提议苹果未来可考虑向外部开发者出租服务器,类似亚马逊、谷歌的公有云模式。该项目前负责人称,苹果芯片主管约翰尼・斯鲁吉是强力支持者,认为这是向企业客户出售自研芯片的机会。

但团队前员工表示,由于财务部门反对,艾伯特的多个项目推进困难。财务部认为,现有服务器利用率太低,不愿再投钱自建云服务,他们相信依赖外部云厂商能更好控制成本。

2023年,艾伯特离开苹果加入通用汽车。他的离职很快引发苹果云团队人才流失,许多他招入的员工也陆续追随他去了这家车企。

转向谷歌云

2022年底ChatGPT3.5的问世,对整个科技行业是颠覆性时刻,也彻底改变了苹果对AI和云的思路。

在ChatGPT出现之前,苹果对Siri的优先目标是尽可能在设备端运行,而非云端,以更好保护用户隐私。ChatGPT展示了巨型云端大模型的潜力后,苹果意识到不能再固守旧模式,必须更多借助云端算力。

但问题来了:苹果内部AI基础设施已开始老化。2023年,公司开始淘汰数据中心里大量老旧且故障频发的英伟达芯片——这件事多年前就该做,却一直被搁置。苹果需要用更适配最新AI的新款芯片替换旧芯片。

在财务部门推动下,苹果选择主要依靠外部云服务商推进AI计划,就像之前处理存储等服务一样。长期云服务商AWS成为苹果AI转型的首个重要合作伙伴,苹果也是亚马逊自研AI芯片Inferentia和Trainium2的早期客户。

与谷歌合作则更为曲折。多年来,出于隐私顾虑,苹果禁止AI工程师使用谷歌云。Siri处理大量用户个人身份信息,苹果不愿承担数据外泄风险。苹果软件负责人克雷格・费德里吉——实际上也是苹果隐私“沙皇”——曾多次否决使用谷歌云提供AI算力。

但2023年,谷歌对安全系统进行升级,满足了苹果的隐私要求。苹果迅速开始采用谷歌云满足AI需求,包括使用谷歌定制芯片张量处理单元(TPU)——苹果测算,其运行成本远低于英伟达同类芯片。

私有云

苹果需要向外界证明自己在认真对待AI。ChatGPT的爆发式增长,迫使谷歌、亚马逊等几乎所有科技巨头都推出更智能、对话式的AI产品。2024年苹果全球开发者大会上,苹果终于出手,宣布推出AppleIntelligence——一套基于生成式模型的AI工具集。

苹果指派此前由艾伯特牵头的ACDC项目团队支援AppleIntelligence上线。尽管该项目最初并非聚焦AI,团队还是紧急搭建了代号Thimble的**私有云计算(PrivateCloudCompute)**系统,为下一代AI产品提供更私密的算力支持。

参与该项目的前员工称,尽管苹果在2024年6月与AppleIntelligence一同宣布了私有云计算,但该系统当时尚未真正可用,进度滞后六个月(最终于2024年底上线)。

随后几个月,苹果陆续上线AI写作、通知摘要等AppleIntelligence功能,但公众和科技媒体普遍感到失望。对苹果而言,更大的问题是:彻底重构、更具对话能力的新版Siri迟迟无法推出。

苹果与谷歌洽谈Siri托管事宜,可能表明苹果希望为今年晚些时候新版Siri上线后设备端AI流量暴增做好准备。

谈判背后的另一个原因可能是:私有云计算在苹果自有数据中心里表现不佳。前员工称,其AI服务器的软件更新耗时远高于普通服务器。此外,苹果云工程师和AI员工透露,私有云计算服务器上的苹果芯片并非为AI设计,难以流畅运行谷歌Gemini这类大模型。