去年6月,在苹果年度开发者大会上,该公司曾展示了一项令人惊叹的演示,说明人工智能技术将如何为Siri(iPhone的虚拟助手)注入新动能。但在幕后,随后的数月里,Siri团队始终未能就实现这一愿景所需的基础技术达成共识。
据一位参与该项目的苹果前员工透露,团队曾考虑开发小型和大型两种语言模型,并分别命名为"迷你鼠"(Mini Mouse)和"巨无霸鼠"(Mighty Mouse)。小型模型将部署在用户iPhone端,处理设置闹钟等简单指令;大型模型则运行于云端,负责自动预订优步车辆赶赴会议等复杂任务。
随后Siri团队却改变方向,转而试图打造能处理所有任务的单一大型模型。这意味着需要将Siri软件完全云端化,这与此前将大部分Siri功能移至设备端以保护隐私的策略背道而驰。此后又接连出现重大技术转向,令Siri团队成员倍感挫败,甚至有人因此离职。这使得其今年发布新版Siri功能的计划岌岌可危。
这种决策反复成为苹果上个月宣布推迟发布新Siri功能至2026年的重要导火索。据四位知情人士透露,苹果内部已告知员工,将解除人工智能主管John Giannandrea及其副手Robby Walker对Siri项目的领导权,后者原本负责日常运营。
接任者方面,苹果宣布将由软件工程负责人Craig Federighi接管Siri业务,此前领导Vision Pro混合现实头戴设备开发的苹果高管Mike Rockwell 将接手Robby Walker的职责。(彭博社最先报道了此次人事变动。)
对于九个月前刚在开发者大会上向投资者承诺将通过Siri升级等措施重振人工智能布局的苹果而言,此次延迟无疑是一次重大挫败。尽管长期以来,外界对Siri创新迟缓的批评声不绝于耳,但随着OpenAI的ChatGPT等人工智能产品近年爆红,相关质疑声浪愈发强烈。
对于全球市值最高的科技公司而言,如何把握人工智能机遇或许是其当前面临最具深远影响的挑战——这一抉择将直接决定iPhone及其他苹果产品能否继续保持技术领先地位。
苹果在人工智能领域的困境,部分源于其根深蒂固的企业价值观。例如,公司对用户隐私的强硬立场,既限制了训练模型所需的大规模数据获取,也加大了对设备端人工智能功能效果的验证难度。但多位曾在Giannandrea领导的AI/ML(人工智能/机器学习)部门工作的员工指出,更深层的症结在于内部人格冲突。超过半数曾在该部门任职的前苹果员工向《The Information》表示,执行不力主要归咎于领导层缺陷,特别指出Walker既缺乏远见,又不愿在语音助手未来版本设计中承担风险。
在苹果工程师群体中,这个AI团队宽松的文化氛围与执行乏力甚至为其赢得了一个戏谑绰号——AIMLess(取自AI/ML缩写,暗含"无目标"之意)。这种内部负面评价与Federighi自2012年执掌的软件工程团队形成鲜明对比,后者凭借iOS系统及信息、照片、邮件等应用的开发,树立了高效执行的口碑。
多位前苹果员工将Siri比作"烫手山芋",在包括服务业务负责人Eddy Cue和Federighi领导的多个团队间不断转手,但历次重组都未能显著提升其性能。如今时隔七年,Siri重归Federighi管辖,部分前员工认为这一调整早该进行,特别是考虑到AI团队此前糟糕的记录。
例如,Federighi团队旗下的机器学习部门近年来逐步承担更多AI职能,与Giannandrea的部分团队产生摩擦。目前由Federighi负责的AI团队主导着迄今成功发布的多项AI功能,统称为"Apple Intelligence"。截至发稿,苹果发言人未对此置评。
Siri的问题根源
Siri的困境早在近年危机爆发前就已埋下伏笔。
2018年,Giannandrea从谷歌跳槽至苹果,执掌新成立的人工智能部门。这一任命被科技行业视为苹果的重大胜利。尽管部分高管认为他可能更关注自动驾驶汽车项目(该项目后已被搁置),但他却对Siri格外重视。据知情人士透露,彼时的Siri作为苹果2011年推出的iPhone功能,已显露疲态:它难以回答常识性问题,对第三方应用的支持也极为有限。
甚至在Giannandrea正式接管Siri之前,负责该项目的团队已在苹果内部沦为“二等公民”。据多位直接了解情况的前员工称,Siri工程师对软件工程团队掌控iOS更新感到不满,认为后者未将修复Siri问题列为优先级;而软件工程师一方则指责Siri团队无力支持Federighi团队推出的新功能。
Giannandrea曾公开表示,他有信心通过借鉴谷歌打造自家AI语音助手的经验来扭转Siri局面。据与其交流过的人士透露,他认为苹果只需优化训练数据,并提升从网络抓取答案的能力,即可改善Siri应对常识性问题的表现。
在某种程度上,Giannandrea在苹果同事中显得与众不同。与他共事过的人形容他随和、低调且避免冲突——这与苹果许多其他以强势、A型人格著称的高管形成鲜明对比。
Giannandrea经常向员工阐述他的信念:机器学习可以通过渐进式改进推动产品提升,最终实现重大突破。他将这一理念称为"爬山法"(hill climbing)。过去他曾对聊天机器人持怀疑态度,在ChatGPT发布前后明确告诉苹果员工,他认为这类技术对用户价值有限。
加入苹果后,有同事建议他重组Siri领导层,但据苹果人工智能部门前员工透露,他并未采纳这一提议。一位曾被同事批评的Siri负责人Walker于2013年加入苹果,并于2022年底开始负责其日常运营。在批评者眼中,Walker不愿对Siri押注重大创新,专注于提升无关痛痒的指标而非制定颠覆性语音助手改革蓝图。
例如,前苹果工程师透露,Walker常因将Siri响应延迟缩短微小百分比而庆祝"胜利"。他另一个标志性项目是去掉唤醒词"Hey Siri"中的"Hey",而这个改动耗费了两年多时间才完成。
去年,一位知情人士透露,Walker驳回了工程师团队提出的利用大型语言模型(LLMs)赋予Siri更强情感感知能力的提议,该项目旨在让Siri能够识别处于困境的用户并给出恰当回应。Walker告诉同事,他希望专注于Siri下一版本的发布,而非投入资源到这个项目中。工程师们未告知Walker便绕过他,继续与软件工程团队的安全与定位小组合作开发相关功能。
薪资更高,晋升更快
随着时间推移,Federighi领导的软件工程团队与Giannandrea负责的AI团队关系日趋紧张,甚至陷入功能失调状态。
两位高管的风格截然不同:Federighi以严厉苛刻的管理风格著称,与Giannandrea轻松随和的方式形成鲜明对比。据参会者透露,两人在会议上共处时,Federighi会不断向同事提出尖锐问题,而Giannandrea更多时候选择倾听。
其他不满情绪也在不断累积。软件工程团队中的一些人对AI团队成员获得更高薪资、更快晋升感到愤懑。他们还怨恨AI团队的部分工程师似乎享有更长假期、周五提前下班等优待,而自己却要承受更严苛的工作节奏。
两团队间的不信任恶化到如此程度:今年早些时候,Giannandrea的一名副手要求工程师对联合项目进行详尽过程记录,以确保若项目失败,Federighi的团队无法将责任推诿给AI团队。
当Federighi开始组建自己麾下数百人的机器学习工程师团队"智能系统部"(Intelligent Systems),并由其得力副手Sebastien Marineau-Mes执掌时,双方关系更趋恶化。多年来,该部门自主训练模型并开发出用户可通过语音指令操控应用的演示程序,这些工作常绕开Siri团队独立完成,引发后者强烈不满。在一次苹果内部演示中,智能系统部成员展示了一张两座山峰碰撞粉碎的动画幻灯片,两名知情人士称这被视作对Giannandrea"爬山法"理念的隐晦讽刺。
约2022年前后,智能系统部开始与Walker及负责Vision Pro的Rockwell合作推进代号"Link"的项目,但很快陷入困境。四位直接知悉该项目的前苹果员工透露,该项目的目标是开发用于混合现实头显及未来增强现实眼镜的语音控制指令系统。
参与三方协作会议的工程师们明显感受到Rockwell与Marineau-Mes对负责Siri日常事务的Walker展现的公开敌意。二人频繁对Walker施压,不满Siri在支持Vision Pro时进展迟缓。
例如,Rockwell希望用户佩戴头显时能仅通过语音指令让Siri实现网页浏览和窗口尺寸调整功能。他还设想让身处虚拟空间的两人协作时能同步调用Siri,从而共同规划旅行等场景。
但据知情人士透露,Siri团队部分成员对这些目标的可行性存疑。最终,由于Siri团队未能实现预期效果,Rockwell最初构想的Vision Pro相关功能大多遭到削减。
人工智能热潮兴起
2022年11月,OpenAI发布ChatGPT,在科技行业和公众中引发强烈反响。然而,据当时在Giannandrea AI团队工作的前工程师透露,该团队的高层并未展现出紧迫感。
Federighi领导的软件工程团队内部反应却截然不同。据多位前苹果员工称,智能系统部(Intelligent Systems)的高级领导立即开始分享有关大语言模型(LLMs)的论文,并公开探讨如何将其用于改进iPhone。
在智能系统部团队向Federighi展示iPhone端AI应用的演示后,软件工程团队的热情被点燃。这些演示利用OpenAI的模型,展示了AI如何理解用户手机屏幕内容,并通过更自然的语音交互帮助用户导航应用、执行任务等场景。
前苹果员工表示,AI团队和软件工程团队曾争相宣称对LLM驱动的新功能拥有主导权。由于软件工程团队长期以“成果交付能力”著称,多数情况下他们最终胜出。
尽管苹果尝试使用OpenAI的模型进行实验,但2023年该公司管理层明确告知工程师:最终产品中不得集成外部公司的模型,仅允许将其用于内部模型的性能基准测试。
根据2023至2024年间曾使用过相关模型的多位前苹果员工透露,Giannandrea团队负责构建的苹果大模型在性能上远不及OpenAI的技术。
一场存疑的演示
去年6月,苹果宣布推出名为“Apple Intelligence”的AI功能套件,涵盖写作与图像生成工具、新版照片编辑与邮件功能以及Siri升级。值得注意的是,苹果一改此前立场,宣布与OpenAI合作,将ChatGPT作为补充工具,用于处理其自有模型无法完成的问题或任务。
在发布会上,一位苹果高管对着台下演示询问Siri:“我母亲的航班何时降落?”Siri随即访问其邮箱和实时航班数据,给出了准确到达时间。随后该高管又要求Siri提醒午餐计划,Siri便从iPhone消息中提取细节,并规划出从机场到餐厅的路线。
然而,这一演示令Siri团队成员感到震惊。据一名前苹果员工透露,团队此前从未见过这些功能的可用版本。当时,演示中唯一已激活的新功能是——当用户唤醒Siri时,iPhone屏幕边缘会显示一道脉冲式彩色光带。
对苹果而言,这场Siri演示打破了其传统做法。过去,苹果仅在产品已通过测试设备验证且营销团队确认能按时发布后,才会在发布会上展示相关功能。
尽管存在诸多争议,苹果此次发布会仍给外界留下深刻印象。在宣布推出AI功能套件后,苹果股价在两天内飙升逾10%,华尔街对其终于提出明确的AI发展计划表示认可。
部分前苹果员工表示,鉴于Federighi和Rockwell向来比Giannandrea与Walker更注重细节管理——后者更多依赖下属团队自主运作——他们有望扭转Siri的颓势。
以Federighi为例,他对软件项目的技术细节掌握程度甚至超过参与研发的初级工程师。而2015年加入苹果的Rockwell,则被视作兼具远见卓识与务实能力的领导者,既能引入创新思维,又深谙如何在苹果的企业文化中推动变革。
Federighi已开始推行重大改革。据知情人士透露,他打破以往政策,要求Siri的机器学习工程师“不惜一切代价”打造最佳AI功能,甚至允许在软件产品中使用其他公司的开源模型,而非仅限于苹果自研模型。

