大数跨境

AI Agent 新星 Manus:从本土创业到新加坡总部,产品迭代中的机遇与 “被吞噬” 风险

AI Agent 新星 Manus:从本土创业到新加坡总部,产品迭代中的机遇与 “被吞噬” 风险 元龙数字智能科技
2025-07-11
0
导读:AI Agent新星Manus从本土创业到新加坡总部产品迭代中的机遇与 “被吞噬” 风险2025 年的 AI

AI Agent新星Manus

从本土创业到新加坡总部

产品迭代中的机遇与 “被吞噬” 风险

2025 年的 AI 行业正经历一场静悄悄的范式转移。当 ChatGPT 式的对话交互已沦为科技产品的基础配置,一个更激进的概念开始撕裂行业认知 ——AI 不仅要能 "说",更要能 "做"。在这场从 "语言模型" 到 "行动代理" 的转型中,一款名为 Manus 的产品以破局者姿态闯入视野,它用短短半年时间完成了从中国明星创业公司到新加坡全球总部的蜕变,也将 AI Agent 的商业化命题推向了聚光灯下。

2025 年初的硅谷会议室里,投资人讨论的关键词已从 "大模型参数" 转向 "工具调用能力"。这种转向的背后,是用户对 AI 价值的期待升级:当聊天机器人能写邮件、做总结后,人们开始追问 —— 它能不能直接帮我发邮件?能不能自动整理会议纪要并同步到日历?这种对 "行动能力" 的渴求,催生了 AI Agent 的爆发。行业并非没有先行者。2025 年 1 月,OpenAI 发布 Operator 研究预览版,首次展示了大模型自主调用搜索引擎、代码解释器的能力,但这个仅面向开发者的实验性产品,更像一次技术探路。真正将 AI Agent 推向大众视野的,是 3 月亮相的 Manus。与同类产品相比,Manus 的出场自带戏剧张力。其发布会没有堆砌技术参数,而是用一则短片讲述了一个创业者的日常:清晨让 Manus 整理昨夜邮件并标记紧急事项,上午自动生成客户提案并同步至云盘,下午根据行程规划预约会议室并发送提醒。这种 "AI 成为第三只手" 的场景化演示,精准戳中了职场人的效率痛点。更巧妙的是,演示结尾,当 AI 完成所有任务后,屏幕弹出一行字:"Manus,拉丁语意为 ' 手'"—— 品牌与愿景的绑定,让它在发布首日便登上 TechCrunch 头条。这种精准的产品定位迅速吸引了资本注意。4 月,成立仅数月的 Manus 宣布完成 7500 万美元 B 轮融资,领投方是硅谷老牌风投 Benchmark。在投资备忘录中,Benchmark 合伙人 Sarah Tavel 写道:"大模型的终极战场不在实验室,而在用户的日常行动中。Manus 证明了它懂得如何让 AI 走出对话框。" 这笔融资的特殊性在于,它是 Benchmark 近三年来首次领投非美国本土 AI 初创公司,这为后续的全球化布局埋下伏笔。

与此同时,Manus 的生态动作同样密集。它先后接入 Anthropic 的 Claude 3 Opus、Google 的 Gemini Ultra 等顶级大模型,成为 Anthropic 生态大会上唯一重点展示的第三方 Agent 应用。在旧金山的演示现场,Manus 团队用 Claude 驱动的代理完成了 "从构思到发布一篇行业分析博客" 的全流程:自动搜索最新数据、生成图文内容、同步至 WordPress 并设置定时发布,整个过程无需人工干预。这种 "模型即服务" 的整合能力,让它迅速跻身 AI Agent 第一梯队。为了贴近全球用户,Manus 团队开启了一场 "反常规" 的市场活动。从纽约的科技沙龙到尼泊尔加德满都的创业者聚会,创始人带着产品原型与当地用户面对面。在加德满都的见面会上,一位旅游创业者用 Manus 规划了 "喜马拉雅徒步路线 + 文化体验" 的定制行程,系统自动调用当地酒店 API、查询徒步许可政策、甚至联系了向导服务 —— 这种在基础设施不完善地区的适配能力,让 Manus 的全球化野心显露无遗。

然而,就在 Manus 快速崛起的背后,一场架构上的剧变正在悄然酝酿。2025 年 6 月,Manus 宣布将总部从北京迁至新加坡,同时在加州帕罗奥图和东京设立办公室。这一决策在国内科技圈引发轩然大波,"跑路" 的质疑声浪渐起,但剥离情绪后,这场迁移更像是一场在复杂全球环境下的生存策略。新加坡的选择并非偶然。作为东西方交汇的金融与科技枢纽,其对 AI 创新的友好政策早已吸引全球玩家 ——OpenAI、Anthropic 均在此设立亚太总部。更关键的是,新加坡的跨境数据流动规则与欧盟 GDPR、美国 CFIUS 审查形成了微妙的平衡。对于依赖全球数据训练和服务的 AI Agent 而言,这种 "合规中立性" 至关重要。背后的现实压力同样不容忽视。2024 年底,美国加强了对 AI 领域跨境投资的审查,尤其是涉及 "具有行动能力的自主代理技术"。根据美国财政部发布的新规,外国 AI 公司若使用美国大模型(如 GPT-4)开发 Agent 产品,其在美业务可能面临数据访问限制。Manus 的核心能力高度依赖 Claude 等美国模型,总部设在北京可能导致其无法深度接入最新模型功能。一位接近团队的人士透露:"迁移是为了保住与 Anthropic 的优先合作权 —— 对方要求核心研发团队必须在 ' 数据主权友好区 '。" 伴随总部迁移的是剧烈的团队重构。国内原 120 人团队中,40 名核心技术人员(含大模型整合、工具链开发、云浏览器架构三个关键团队)被转移至新加坡,其余 80 人面临优化。

这场调整被外界解读为 "裁员",但深入分析可见其必然性:对于一款聚焦应用层的 AI 产品,120 人的团队规模确实偏离了行业常态 —— 同类初创公司如瑞士的 Lumina AI,在用户量相近时团队仅 30 人。团队臃肿的根源可追溯至 Manus 的早期扩张。2024 年启动时,为快速搭建产品原型,团队同时推进了前端交互、后端架构、工具集成等多条线开发,导致人员冗余。例如,仅数据标注团队就有 15 人,而实际上 Manus 作为 "套壳应用",并不需要自建标注体系。一位离职员工坦言:"当时的想法是 ' 先把人招进来再说 ',但很快发现很多岗位与核心目标脱节。" 新加坡新总部的团队架构则更聚焦。技术团队分为三个核心小组:"规划引擎组" 负责优化 AI 的任务拆解能力,"工具接口组" 专注于打通邮件、日历等第三方应用,"用户体验组" 则主攻降低使用门槛。这种精简结构让产品迭代速度明显加快 —— 从新加坡团队接手后,Manus 的功能更新频率从每月 1 次提升至每两周 1 次。

喧嚣的架构调整背后,Manus 的产品逻辑才是其真正的竞争力所在。要理解这款产品,不妨从一个对比开始:传统大模型如同一位被关在书房里的学者,用户递进去一张纸条(输入问题),得到一封回信(输出答案),中间的思考过程完全不可见;而 Manus 则把这位学者请进了开放式办公室,用户能看到他如何查资料、打电话、做笔记,甚至可以随时打断并调整方向。这种 "透明化行动" 的设计源于对 AI Agent 本质的理解。团队认为,通用代理的核心不是 "一次性给出完美答案",而是 "像人类助手一样逐步推进任务"。因此,Manus 的界面中央始终显示着一个 "行动列表":当用户输入 "帮我准备下周与客户的产品演示",系统会先拆解出 "确认客户需求→收集产品数据→设计演示框架→生成 PPT→预约会议室" 等步骤,每个步骤旁都标注着 "进行中" 或 "已完成",用户点击任意步骤,能看到 AI 的具体操作记录(如 "调用 CRM 系统查询客户历史订单")。这种设计的技术支撑是一套 "动态规划 - 执行 - 验证" 闭环系统。规划层由微调后的 Claude 负责,基于用户指令生成初始任务链;执行层通过自研的云浏览器调用各类工具;验证层则会检查每步行动的结果是否符合预期,若不符合则自动修正。例如,当 AI 发现 "生成的 PPT 缺少竞品分析",会自动返回规划层,补充 "搜索最新竞品数据" 的步骤。与 OpenAI Operator 等同类产品相比,Manus 的突破在于 "抗干扰能力"。传统 Agent 在遇到意外情况时容易陷入停滞(比如调用工具失败),而 Manus 会尝试替代方案。测试中,当要求它 "给某邮箱发送带附件的会议邀请" 时,因目标邮箱服务器故障,系统自动切换为 "生成邀请链接并发送短信提醒",最终完成任务。

这种灵活性来自其 "模糊逻辑" 设计 —— 不预设固定的行动路径,而是让 AI 根据实时反馈调整策略。但理想与现实的差距很快显现。产品初期,许多用户面对空白输入框时陷入困惑。一位市场从业者回忆:"我知道它能做复杂任务,但不知道该从何说起。输入 ' 帮我做市场分析 ',得到的结果太笼统;输入太具体,又失去了 Agent 的意义。" 这种 "使用门槛高" 的问题直接反映在数据上:2025 年 4 月,Manus 的周活跃用户量在达到峰值后连续三周下降,降幅达 30%。另一个痛点是效率与成本。由于每次行动都需要调用大模型多次(规划、执行、验证各一次),单任务的成本是普通聊天的 5-8 倍,运行速度也偏慢 —— 完成一份 10 页的 PPT 平均需要 8 分钟,而用户预期通常在 3 分钟内。一位付费用户抱怨:"有时候等它做完,我自己都快手动完成了。" 针对这些问题,Manus 在 6 月推出了两项关键调整。其一是 "聊天模式(Chat)",用于处理 "写邮件"" 查天气 "等简单任务,不启用复杂的规划引擎,成本降低 70%,响应速度提升至 1 秒内。其二是"Playbook 模板库 ",为常见场景提供现成的指令框架。Playbook 的设计堪称" 降维打击 "。以" 社交媒体运营 "模板为例,系统会引导用户填写" 平台类型 ""目标受众"" 内容风格 "等结构化信息,再自动生成执行方案。这种设计巧妙解决了" 不知道怎么用 "的困境 —— 数据显示,使用模板的用户留存率比直接输入指令的用户高 40%。成本与速度的优化则来自架构重构。

技术团队通过三个手段实现突破:一是" 任务合并 ",将重复的模型调用合并为一次(例如,规划与验证环节共享部分参数);二是" 轻量工具 ",对浏览器、计算器等简单工具采用本地计算,减少模型依赖;三是" 动态资源分配 ",根据任务复杂度自动调整模型调用的参数(简单任务用 Claude Instant,复杂任务用 Claude Opus)。这些措施让单任务成本从 0.8 美元降至 0.16 美元,速度从 8 分钟压缩至 4 分钟。

Manus 的产品进化背后,是一套清晰的产品哲学 ——"less structure, more intelligence"(更少结构,更多智能)。这一理念深刻影响着它的每一个设计决策,也埋下了独特的机遇与挑战。团队对 "少结构" 的坚持近乎偏执。一个广为人知的细节是:Manus 的代码库中没有任何预设的 "工作流模板"。传统 Agent 产品(如 Zapier AI)会为 "邮件跟进客户" 等场景设计固定步骤,而 Manus 则让 AI 自己摸索最优路径。

例如,面对 "提醒客户续约" 的任务,AI 可能先查日历确认客户空闲时间,再写邮件,也可能直接打电话,完全根据实时信息决策。这种思路的底层逻辑是对大模型能力的信任。Manus 创始人在博客中写道:"如果我们为 AI 画好路线图,它永远学不会自己过马路。" 团队认为,当前大模型的局限性是暂时的,过度设计的结构会成为未来能力升级的枷锁。例如,当 Claude 3 具备更强的推理能力后,原本为 Claude 2 设计的工作流反而会限制其发挥。选择做 "套壳应用" 是这种哲学的延伸。Manus 没有自建大模型,而是整合 Claude、Gemini 等业界最优模型,专注打磨应用层体验。这种策略让它得以在 6 个月内推出产品,而从头研发大模型至少需要 2-3 年。更重要的是,它能灵活切换底层模型 —— 当 Google 发布更擅长多语言的 Gemini Ultra 2 时,Manus 仅用两周就完成了接入,这种敏捷性是自研模型公司难以比拟的。但 "套壳" 的风险同样尖锐。底层模型的能力直接决定 Manus 的上限:如果 Claude 的工具调用能力出现瓶颈,Manus 的任务执行效率会同步下降;一旦 Anthropic 推出原生 Agent,Manus 可能瞬间失去竞争力。2025 年 5 月,Anthropic 在开发者大会上演示了 Claude 的 "自主行动" 功能,虽未正式发布,但已让 Manus 团队紧急启动 "差异化方案"—— 加速开发独家工具接口,试图用生态壁垒对冲模型依赖。另一个挑战来自用户认知。"无预设工作流" 虽然灵活,但初期让用户难以适应。许多用户习惯了 "点一下按钮就完成任务" 的确定性,而 Manus 的 AI 可能每次行动路径都不同。例如,同是 "订机票",第一次 AI 先查价格,第二次可能先查航班时间,这种不确定性让部分用户产生不信任感。一位产品经理坦言:"我们在 ' 灵活性 ' 和' 确定性 ' 之间走钢丝,平衡起来并不容易。" 商业化路径也仍在探索。Manus 采用 "免费 + 付费" 分层模式:免费用户每月可使用 5 次复杂任务,付费用户(20 美元 / 月)无限制。但目前付费转化率仅 5%,远低于行业平均的 10%。核心问题在于用户尚未形成 "为 AI 行动付费" 的习惯 —— 许多人愿意为 ChatGPT 的对话能力买单,但对 "AI 帮我发邮件" 的价值感知不强。团队正在测试 "按结果付费" 模式,例如 "成功预约会议才收费",试图提升付费意愿。

褪去概念光环,Manus 的实际表现究竟如何?通过多场景测试,我们得以窥见这款产品的能力边界与改进空间。打开 Playbook 中的 "AI 健身教练" 模板,系统先弹出一系列选择题:"健身水平(新手 / 中级 / 高级)"" 目标(增肌 / 减脂 / 全面健身)""身体限制(膝盖问题 / 腰部不适 / 无)"。选择 "新手"" 全面健身 ""膝盖问题" 后,Manus 开始行动:先调用医学数据库,确认膝盖不适者应避免的动作(如深蹲跳);再结合运动科学文献,筛选游泳、靠墙静蹲等低冲击运动;接着生成 7 日计划,每天包含 30 分钟运动(如周一 "游泳 + 核心训练");随后调用营养 API,匹配每日饮食建议(如补充蛋白质修复关节);最后生成可交互网页,包含进度追踪表和动作演示链接。整个过程耗时 4 分 20 秒,结果完整性远超普通健身 APP 的模板化计划,但细节仍有优化空间 —— 例如,未考虑用户所在地区的游泳馆开放时间,若能接入本地生活服务 API 会更精准。

在测试 "做一个关于人工智能简史的 PPT,面向小学生群体" 时,Manus 的处理步骤清晰可见:先拆解任务,确定受众认知水平→筛选关键历史事件→设计童趣化表达→选择模板风格;接着调用儿童教育数据库,将 "图灵测试" 转化为 "机器能不能假装成人类聊天";从 Unsplash 抓取卡通风格的 AI 发展史插图;最后提供 "太空探险"" 森林奇遇 "两种设计主题,生成 12 页 PPT,每页配 1-2 个互动问题(如" 你觉得机器人能画画吗?")。对比 ChatGPT 生成的 PPT 大纲,Manus 的优势在于" 一步到位 "—— 无需用户手动填充内容,但速度仍偏慢,生成过程中因多次调用图片 API,出现 2 次短暂卡顿。指令" 打开小红书,给硅星人 Pro 发布的最新笔记评论:今天星期五,猴子去跳舞 "则考验工具调用的实操能力:云浏览器自动打开小红书官网,搜索" 硅星人 Pro";定位最新笔记(发布于 10 分钟前),点击评论框;弹出登录请求,Manus 提示" 需要扫码登录,请您协助 ";用户扫码后,系统遇到拼图验证,再次请求用户完成;验证通过后,输入评论并发布,IP 属地显示美国(因云浏览器服务器位于加州)。整个过程暴露了 Agent 在安全验证环节的短板 —— 目前无法自主完成复杂验证码,需依赖用户协作,但团队已在开发" 人机协作验证 "功能,计划让 AI 识别验证类型,再指导用户快速完成。最具挑战性的测试是" 用皮蛋和香蕉创造一道黑暗料理并生成视频 ",这直接考验多工具协同能力:Manus 先规划步骤,构思菜谱→生成食材处理步骤→调用图像模型生成参考图→调用视频模型生成片段→拼接视频;菜谱设计颇具创意," 香蕉皮蛋奶昔 "(将皮蛋蒸熟去壳,与香蕉、牛奶一起搅拌);调用 Veo3 视频模型生成 3 个片段(切皮蛋、搅拌、成品展示);后台执行 ffmpeg 命令拼接,初期因参数错误导致音频丢失;AI 自动检测到问题(" 音频流未同步 "),修正命令后重新生成 30 秒视频,带配音" 黑暗料理挑战:皮蛋和香蕉的奇妙碰撞 "。这个案例最能体现 Manus 的" 反思能力 "—— 面对错误不中断,而是自主排查并修正,这正是 Agent 区别于普通工具的核心优势。

在 AI Agent 这条拥挤的赛道上,Manus 的处境恰似整个行业的缩影:前景广阔但挑战丛生。它的核心命题已从 "如何做出产品" 转向 "如何活下去"—— 在 OpenAI、Google 等巨头的阴影下,这款 "套壳应用" 能否建立不可替代的壁垒?当下的竞争格局异常激烈。OpenAI 已在 GPT-5 中内置 Agent 功能,支持自动调用插件;Google 的 Gemini Agent 则深度整合 Workspace(邮件、文档),生态优势明显;就连 Meta 也推出了开源 Agent 框架,降低创业公司的入局门槛。在这种环境下,Manus 的 "套壳" 模式既是优势(快速迭代)也是风险(底层依赖)。团队正试图用 "用户工作流深度绑定" 破局。根据其公开 roadmap,未来将推出三大功能:定时任务,如 "每周一自动整理上周邮件并生成周报";跨应用联动,"当日历收到会议邀请,自动在 Notion 创建议程文档";个性化学习,记住用户习惯(如偏好简洁 PPT),逐步优化输出风格。这些功能的核心是让 Manus 成为用户数字生活的 "操作系统",而非单纯的工具。例如,当用户在 Manus 中处理过 3 次客户跟进,系统会自动总结 "最佳跟进时间"(如客户下班后 30 分钟),形成专属知识。但这种壁垒的建立需要时间,而巨头的追赶速度不容小觑。

有消息称,Anthropic 计划在 Claude 4 中直接集成 Manus 擅长的任务规划能力,若成真,Manus 的核心价值将被大幅削弱。一位投资人评价:"这就像 Netflix 依赖好莱坞大片,一旦片方自己做流媒体,Netflix 就危险了。" 对 Manus 而言,更根本的问题或许是如何聚焦。从北京到新加坡的动荡消耗了太多精力 —— 团队承认,过去三个月中,约 40% 的管理层时间用于处理架构调整,而非产品迭代。若能将资源完全投入到 "让 AI 更好地动手做事" 这一核心目标上,它完全可能在垂直场景(如职场协作)建立先发优势。回望 AI 行业的发展,每一次范式转移都伴随着争议与蜕变。从聊天机器人到 AI Agent,本质是人类对 AI 的期待从 "对话伙伴" 升级为 "行动助手"。Manus 的百日剧变,既是一家初创公司在全球科技博弈中的生存选择,也是整个 AI Agent 赛道在理想与现实间的探索缩影。最终决定其命运的,或许不是总部在新加坡还是北京,而是它能否真正成为用户离不开的 "第三只手"—— 毕竟,在拉丁语中,"Manus" 的含义从未改变。

END

【声明】内容源于网络
0
0
元龙数字智能科技
永做第一 使命第一 向善第一
内容 901
粉丝 0
元龙数字智能科技 永做第一 使命第一 向善第一
总阅读730
粉丝0
内容901