大数跨境
0
0

通用 AI Agent 横空出世! 与 DeepSeek 的 "全能管家"VS"专业大脑" 之争

通用 AI Agent 横空出世! 与 DeepSeek 的 "全能管家"VS"专业大脑" 之争 科技牛咨讯
2025-03-06
0

通用 AI Agent Manus:

从云端思考到现实执行的革命


2025 年 3 月 6 日,中国 AI 领域迎来里程碑式突破。一支来自中国的团队正式对外发布通用型AlAgent产品Manus。据团队介绍,Manus在GAIA基准测试中取得了SOTA的成绩,显示其性能超越OpenAl的同层次大模型。

由 Monica 团队研发的全球首款通用型 AI Agent(自主智能体)产品 Manus 正式开启内测,凭借 "感知 - 决策 - 执行" 全链路闭环能力,一夜之间席卷海内外科技圈,引发资本市场热捧。这款被称为 "数字劳动力革命" 的产品,正以颠覆性姿态重新定义人机协作范式。



大脑链接上四肢


Deepseek和Manus有什么区别?

简单来说,Deepseek就像爱因斯坦的大脑,思考后只能通过嘴巴告诉你,你应该做什么事情。

Manus就像爱因斯坦的大脑连接上了四肢。当你提出需求,它直接就替你做完事情,出结果了。

Manus 如同能自主规划行程的管家,从订票到攻略一手包办;而 DeepSeek 更像专业顾问,能精准诊断病情或优化代码。前者追求通用性与任务自动化,后者专注垂直领域深度适配。

官方例子:

提示词: 

我想要一份特斯拉股票的全面分析,包括:概述:公司概况、关键指标、业绩数据和投资建议财务数据:收入趋势、利润率、资产负债表和现金流分析市场情绪:分析师评级、情绪指标和新闻影响技术分析:价格趋势、技术指标和支撑/阻力水平资产比较:市场份额和与主要竞争对手的财务指标对比价值投资者:内在价值、增长潜力和风险因素投资论点:SWOT 分析和针对不同类型投资者的建议 


https://manus.im/share/xFgpHb15vKqfRPWIs3JJPJ?replay=1 

提示词: 

我需要一个 4 月 15-23 日从西雅图出发的 7 天日本行程,预算为我和未婚妻两人 2500-5000 美元。我们喜欢历史遗迹、隐藏的宝地和日本文化(剑道、茶道、禅修)。我们想看奈良的鹿并徒步探索城市。我计划在这次旅行中求婚,需要一个特别场所的建议。请提供详细的行程安排和一个简单的 HTML 旅行手册,包含地图、景点描述、必备的日语短语和我们整个旅程中可以参考的旅行小贴士。 


https://manus.im/share/brWKUSp51ItvVMBpcXNCZ1?replay=1 

OpenAI 的 GPT 系列与 Gym 工具包构建了强大的 AI 基础设施,但其核心定位仍是 "生成式工具集"。例如 GPT-4o 擅长文本创作与逻辑推理,DALL-E3 可根据描述生成图像,但均需用户设计工作流并实时交互。而 Manus 通过多重签名系统驱动,实现 "指令 - 执行 - 交付" 的完整闭环,在金融分析、教育科研等场景中展现出更强的自主性与生产力。


从 "脑" 到 "手" 的进化



Manus 的革命性突破体现在其独创的技术架构上:

01


异步执行引擎:突破传统 AI 实时交互限制,用户关闭设备后仍可云端离线作业。演示显示,Manus 在 6 小时内独立完成跨国房产调研,自动整合犯罪率数据库、学区评分系统及房产交易平台数据,生成带交互式图表的报告。

02


多模态记忆系统:通过深度学习用户历史指令优化任务流程。在简历筛选中,Manus 可记忆用户对 "数据分析师" 岗位的评估维度,下次同类任务直接输出带权重的候选人矩阵。

03


智能工具链:内置 10 万 + API 接口,动态调用 Python、网页爬虫等工具。股票分析场景中,Manus 同步调用金融终端 API 获取实时数据,编写可视化代码并部署至云端服务器,全程无需人工干预。

04


安全沙箱机制:通过虚拟机隔离技术确保数据零泄露。第三方测试显示,处理含敏感信息的财务报告时,数据加密强度达金融级标准。


全场景能力矩阵:覆盖 6 大领域 51 个细分场景

不同于传统 AI 的单一功能,Manus 构建了完整的任务生态:

  • 企业服务:自动生成年度审计报告,跨系统整合财务数据并标注风险点

  • 金融投资:实时监控全球 100 + 交易所,自动触发止盈止损策略

  • 教育科研:辅助博士生完成跨学科文献综述,生成假设验证模型

  • 创意生产:根据用户描述自动生成影视分镜脚本,对接后期制作工具链

  • 生活服务:整合 200 + 平台数据,提供最优旅行方案并自动预订

  • 工业制造:解析 CAD 图纸生成生产指令,实时优化供应链流程

官方展示的教育场景中,Manus 为物理教师自动生成动量定理教学动画,同步调用 3D 建模工具和实验数据模拟器,效率较传统备课提升 80%。

来源来自官方数据:提示词:我是一名中学物理老师,正准备教授动量守恒定律。您能否创建一系列清晰准确的演示动画,并将它们整理成一个简单的 HTML 演示文稿? 

https://manus.im/share/pAdLIvlktJmV945593mFio


性能验证:GAIA 基准测试超越 OpenAI 37%

在权威的 GAIA 基准测试中,Manus 在复杂任务处理维度(包括多步骤规划、跨工具协同、动态决策)取得 SOTA 成绩,综合评分超越 OpenAI 同层次模型 37%。测试显示,Manus 在处理 "创建跨境电商运营方案" 任务时,自动完成市场调研、竞品分析、物流方案设计等 12 个子任务,最终输出可直接执行的 SOP 文档,耗时仅为人类专家的 1/15。


生态布局:从插件到 Agent 的进化路径

作为 Monica 团队的第三代产品,Manus 延续了工具化封装理念,但实现质的飞跃:

  • 技术开源:计划年内开放推理模块代码,已吸引 500 + 开发者申请加入共创社区

  • 企业级 API:支持与 ERP、CRM 系统无缝对接,某头部券商测试显示,Manus 处理研报撰写效率提升 400%

  • 开发者生态:提供低代码开发平台,非技术人员可通过可视化界面创建专属 Agent


争议与展望:AGI 时代的中国答卷

尽管 Manus 引发现象级关注,行业仍存理性讨论:
  • 技术原创性:部分从业者指出其架构与海外开源框架存在相似性,但团队通过多重签名系统实现创新突破

  • 商业化路径:内测阶段的邀请码黑市炒至 5 万元,但官方强调将坚持免费增值模式

  • 伦理风险:自动决策可能带来的责任归属问题,团队已启动区块链存证系统研发


AI 不再只是陪你聊天的 "电子宠物",而是能像人类同事一样独立完成工作?这正是 Manus 带来的颠覆 —— 这个全球首款通用型 AI Agent(自主智能体),正在重新定义人机协作的边界。

不同于 ChatGPT、Claude 这类 "动口不动手" 的对话式 AI,Manus 更像一位全能助理:

  • 工具调用专家:能主动使用浏览器、代码编辑器、数据分析工具等完成复杂任务

  • 云端独立工作者:在后台自主运行,无需用户持续监督

  • 成长型伙伴:会记住用户偏好,不断优化工作方式


与 Manus 协作的正确打开方式

1. 任务委托技巧

渐进式协作:先让 Manus 完成部分任务,再根据中间结果调整方向

明确需求:说明最终成果的格式要求和质量标准

知识沉淀:告诉 Manus"记住这种方式",让它在未来工作中应用经验

2. 动态调整策略

当任务执行出现偏差时,直接介入指导:

"试试别的方法" —— Manus 会迅速调整策略

"增加这个维度的分析" —— 实时修改任务参数


当前挑战与未来展望

尽管 Manus 展现出革命性能力,仍处于快速进化阶段:

技术局限:部分需扫描验证的网站(如知乎)可能被卡死

场景适配:复杂跨系统任务偶发卡顿

伦理探索:自动决策的责任归属问题正在研究区块链存证方案


Manus 的诞生正值全球 AI Agent 赛道爆发期。谷歌的 Project Mariner、微软的 Copilot Vision 均在布局智能体技术,而中国团队通过 Manus 的内测,已展现出在通用型 Agent 领域的领先优势。尽管面临技术原创性争议与商业化挑战,其 "将 AI 从云端想法转化为现实行动" 的核心理念,正在重塑人机协作的未来图景。

正如其命名源自拉丁语 "心智与手",Manus 的终极目标是成为人类能力的延伸。随着内测推进,这个 "数字实习生" 能否真正改变全球工作方式?或许正如其官网标语所言:"当 AI 开始思考如何完成你的思考,人类将专注于更有意义的创造。"


END



科技牛产学研+互联网平台





【声明】内容源于网络
0
0
科技牛咨讯
企业技术的研发中心,科研成果的转化中心。关注我们,带你了解前沿科技资讯、最新科研成果。
内容 3688
粉丝 0
科技牛咨讯 企业技术的研发中心,科研成果的转化中心。关注我们,带你了解前沿科技资讯、最新科研成果。
总阅读30
粉丝0
内容3.7k