
作者丨郝鑫 吴先之
编辑丨王潘
电影《某种物质》中,主人公伊丽莎白为留住青春,通过注射药剂分裂出克隆体苏。如今,大模型正让互联网大厂感受到“衰老”的焦虑,百度、阿里、字节等企业纷纷寻找自己的“苏”。
字节旗下的“豆包”正在快速扩展,从AI助手延伸至输入法、TWS耳机,再到定制智能手机系统。12月1日,字节发布了一款搭载豆包手机助手的工程样机——中兴旗下努比亚M153,配备高通骁龙8至尊版芯片、16GB内存+512GB存储,售价3499元。
该芯片搭载新一代Hexagon NPU,支持端侧多模态生成式AI应用,可实现语音识别与大语言模型交互,为豆包助手提供底层支撑。尽管M153硬件配置在同级机型中并不突出,但字节更注重功能体验而非参数比拼,反映出其合作策略重在技术落地。
豆包手机助手支持语音唤醒和侧边AI键两种方式,需与终端厂商深度协作。前者替代原厂语音助手,后者则涉及硬件定义。实际演示中,助手能读取屏幕内容、理解图像、跨平台比价下单、远程控车,并完成旅行规划中的机票、门票、餐厅预订等复杂任务,耗时约8分钟。
这一模式超越了简单的Agent操作,更像Siri式的系统级整合,统一入口、打包服务,标志着AI助手正被大模型重构。

互相克隆与排异反应
为突破用户增长瓶颈并寻找最佳落地形态,豆包已尝试PC、移动端、浏览器插件及飞书生态嵌入等多种路径。然而缺乏硬件载体使其易沦为“轻量级外挂”。
去年10月推出的Ola Friend AI耳机受限于TWS形态,依赖云端运算,离线能力弱。相比之下,手机作为最高频使用的终端,成为大模型落地的关键战场。与手机厂商合作,有助于豆包跳出“云端孤岛”,同时激活AI耳机等周边产品。
选择努比亚而非华米OV等主流品牌,既有现实考量,也意在打造标杆案例。努比亚生态相对开放,原有“小牛”语音助手影响力有限,便于系统级替换。此举类似华为智选车模式:以技术换硬件落地,推动标准化接口与端侧数据处理,解决权限与隐私问题。
视频显示,豆包已深入调用底层权限,具备端侧记忆、跨App代操作能力,通过本地加密存储与GUI模拟点击,实现从工具到助理的转变。但这也引发手机厂商对“灵魂丧失”的担忧——引入第三方AI助手或将削弱自研产品的地位。
技术并非最大障碍,商业与组织协调才是挑战所在。对于手机厂商而言,豆包只是“第三方服务商”,涉及底层适配时流程复杂,合作存在天然“排异反应”。

谁是苏,谁是伊丽莎白?
有头部手机厂商高管指出,端侧AI部署尚处初期,如何优化内存占用与性能调度仍在探索中。虽然表态愿与三方合作,但实际进展缓慢,多数厂商AI功能未发生结构性变化。
OPPO是少数迈出较大步伐者,收购波形智能后吸纳其核心团队,强化文本处理与个性化AI(LPA)能力。而豆包的演示展示了更高阶的自动化能力:基于用户收藏的巴黎餐厅信息,自动标记地图、推荐展览并完成订票。
更深层矛盾在于,主流手机厂商均拥有庞大AI团队,与豆包合作将冲击内部架构。当前行业共识是软硬协同优化,苹果与OpenAI的合作提供了“本地隐私+云端算力”的范本。
字节走出第三条路:以豆包为支点,采用“类Siri”模式部署于手机端,不直接操控系统,而是作为智能调度中枢,连接功能、服务与设备。这种模式以软件体验撬动硬件销售,使模型成为消费决策的关键因素。
未来趋势正从“谁定义谁”转向“共同进化”,软件与硬件边界日益模糊。

入口再定义
豆包的定位正在悄然升级——从一款AI应用向系统级入口演进。2025年10月,QuestMobile数据显示,豆包以5410万DAU位居AI原生应用首位,已形成显著规模优势。
不同于Kimi聚焦资本市场、DeepSeek强调推理能力,豆包坚持低门槛通用路线,语音输入被置于核心位置,并复用于豆包输入法设计。字节将其视为大型A/B测试场,通过Token调用量验证高频功能与技术刚需。
随着DAU竞争告一段落,焦点转向“入口之争”。阿里千问近期深度融合夸克、浏览器与智能眼镜,试图整合阿里生态入口。而字节反向切入安卓手机阵营,提出另一种入口形态:以豆包打通非苹果、非鸿蒙系统的手机厂商通道。
此前面壁智能、阶跃星辰等创业公司因资源不足难以深度绑定厂商。豆包则凭借字节的技术积累与用户基础,成为“先头兵”,目标是成为安卓阵营的标准化AI中枢,实现“所见即可问,所言即可为”。
短期内仍面临挑战:大模型稳定性影响功能复现率;深度系统整合需大量工程投入;长期还需平衡与安卓厂商之间既合作又博弈的关系。
字节“不造手机,却想定义手机灵魂”的战略,正将AI入口之争推向关键阶段。这场变革背后,是对软硬一体本质的重新思考,也暗含不可避免的生态冲突。



