豆包手机助手:字节的“类Siri”落地实践
撰文|郝鑫 吴先之
编辑|王潘
电影《某种物质》中,主人公伊丽莎白为留住青春注射药剂,分裂出克隆体苏。在大模型竞赛中,互联网大厂亦面临“衰老焦虑”,纷纷寻求自己的“苏”——可深度嵌入终端、具备主动服务能力的AI助手。
12月1日,字节跳动联合中兴旗下努比亚发布搭载豆包手机助手的工程样机M153,配备高通骁龙8至尊版芯片、16GB+512GB存储,售价3499元。
该芯片搭载新一代Hexagon NPU,支持端侧多模态生成式AI应用,可实现语音识别、大语言模型交互及屏幕内容理解等核心能力。
M153硬件配置未达旗舰水准,表明字节当前合作重心在于功能体验验证,而非参数比拼。
豆包手机助手支持语音唤醒与侧边AI键双入口,需与厂商协同开发:前者替代原生助手,后者参与硬件定义。
实际演示显示,其可读取屏幕、理解照片、跨平台比价下单、远程控车,并在8分钟内完成机票、门票、餐厅全流程预订,体现端侧长文本处理、记忆存储与个性化调度能力。
相较于Computer Use式的系统级操控,豆包走的是“类Siri”路径——作为智能调度中枢,连接手机功能、内容服务与IoT设备,不追求底层接管,重在统一唤起与生态集成。
互相克隆与排异反应
为突破“轻量级外挂”困局,豆包已尝试PC端、移动端、浏览器插件、飞书内嵌等多种形态;去年推出的Ola Friend AI耳机则受限于TWS物理边界,依赖手机联网,离线能力薄弱。
手机作为用户日均交互最频繁的终端,是大模型落地的必争之地。选择努比亚合作,既因其中兴背景下系统权限开放度较高,也意在打造标杆案例,向安卓阵营释放“系统级嵌入”可行信号。
视频演示显示,豆包已深入调用底层权限,实现OTA跨平台操作;其端侧记忆加密存储与GUI模拟点击能力,标志着从工具向助理的升级。
该模式类似华为智选车——以技术主导权换取硬件落地,通过标准化接口解决权限与隐私争议,推动安卓阵营建立统一AI助理接入规范。
但合作难点不在技术,而在商业逻辑:手机厂商自研AI团队庞大,引入豆包将动摇内部定位;而对华米OV而言,“让渡灵魂”存在天然焦虑,与豆包之间存在明显排异反应。
谁是苏,谁是伊丽莎白?
端侧AI部署尚处早期,手机厂商仍在探索内存调度、能效平衡与散热控制等底层优化路径。
OPPO收购波形智能并吸纳其核心团队,正加速构建LPA(长期个性化AI)能力;而多数厂商当前AI助手仍停留在“点杯咖啡”层级,尚未实现豆包式的复杂场景闭环执行。
在巴黎旅行案例中,豆包基于社交收藏、地图标记与行程记忆,自动插入奥赛美术馆观展安排,并完成OTA订票,展现了多源数据融合与长周期任务编排能力。
苹果与OpenAI合作范式是“本地隐私+云端推理”,而字节选择第三条路:以豆包为品牌载体,通过“类Siri”模式下沉至安卓手机,撬动硬件销量与生态联动,使AI能力成为消费决策变量。
入口再定义
2025年10月QuestMobile数据显示,豆包DAU达5410万,居AI原生应用首位;其高频语音输入设计贯穿输入法、耳机、手机等全场景,成为低门槛通用助手的关键路径。
相较阿里千问聚焦生态内整合(夸克、眼镜),豆包瞄准的是除苹果、鸿蒙外的安卓手机厂商入口——这是面壁智能、阶跃星辰等创业公司难以企及的资源壁垒。
豆包手机助手是字节端侧战略的“先头兵”,背后是统一品牌下的大模型技术、产品化能力与场景洞察力。其终极目标,是成为安卓阵营的“标准化Siri”,实现“所见即可问,所言即可为”。
短期挑战在于技术确定性不足与厂商定制整合成本;长期关键,则在于如何在合作中平衡赋能与博弈,重塑软件与硬件的关系——从“谁定义谁”,走向“共同进化”。
字节“不造手机,却想定义手机灵魂”的战略,正将AI入口之争推向更微妙、更关键的阶段。

