编辑部 整理自 AIGC2026 | 量子位
当全民都在“养龙虾”时,真正的问题才刚刚浮现。
在刚结束的 2026 中国 AIGC 产业峰会上,亚马逊云科技产品技术部技术总监王晓野披露了一组关键数据:
87% 的企业宣称已大规模部署 AI,但真正从中获得生产价值的仅占 10%。
Demo 易做,难的是在企业生产环境中稳定运行。个人在 Mac mini 上运行 Agent 可随时重启,而让数千个 Agent 在企业分布式环境中安全、可信、不中断地运行,则是完全不同的工程复杂度。
演讲从硬核工程视角直击企业痛点:别再指望靠一个模型解决所有问题。从算力性价比、数据安全到 Agent 的记忆管理,每一层都是必须攻克的难题。
注:2026 中国 AIGC 产业峰会由量子位主办,线下参会超千人,线上直播观众近 400 万。
核心观点梳理
- 87% 的企业实现 AI 大规模部署,但仅 10% 获得实际生产价值。
- 个人场景与企业级场景的 Agent 落地存在本质差异。
- AI 的核心不仅是大模型,拿掉模型后的 Harness(驾驭层)才是关键。
- 数据平台需从服务人转向服务 AI Agent。
- Working Agent 的出现将真正颠覆过去 30 年的个人生产力模式。
- Token 成本高往往源于信息冗余,而非单价过高。
企业级 Agent 落地的四大鸿沟
王晓野指出,尽管 Agent 产品与构建框架层出不穷,但能在生产环境大规模稳定运行的寥寥无几。企业跨越落地鸿沟需解决以下四大问题:
模型选择与响应速度
企业需兼顾性价比与敏捷性,能够灵活切换并快速响应日新月异的模型能力变化。
构建复杂度
分布式系统的长期稳定运行极具挑战。企业级 Agent 需具备自动重启、故障恢复及可信数据处理能力,这与个人开发环境的简易操作截然不同。
使用门槛
虽然工程师的使用门槛已降低,但营销、HR 等业务人员在实际应用中仍面临较高壁垒。
人才缺口
具备端到端推动 Agent 落地能力的复合型人才依然稀缺,平台部门需承担赋能整个组织的重任。
亚马逊云科技 CEO Matt Garman 曾指出,AI 和 Agent 带来了市场构建范式的巨变,应用将被重新改造。过去 30 年个人生产力未被真正颠覆,直到 Working Agent 的出现,工作方式才开始发生实质性改变。
数据显示,预计 2028 至 2030 年,超 15% 的企业日常决策将由 Agent 自主完成;2026 至 2028 年间,82% 的企业领导者计划增加“数字员工”比例。麦肯锡预测,Agent 及生成式 AI 带来的增量市场规模将从 2.6 万亿美元增至 4.4 万亿美元。
然而,高渗透率与低价值转化率并存。87% 的企业声称已大规模部署 AI,但真正产生价值的比例仅为 10% 左右。
从 Demo 走向生产的五大能力
要将 Agent 从 Demo 推向生产,企业 IT 平台需聚焦五大核心能力层级:
算力层:追求极致性价比
Agent 场景对推理算力的需求日益突出。通用芯片难以在所有场景提供最优性价比,企业应利用面向具体场景优化的专用芯片(如 Trainium、Graviton)来降本增效。
模型层:保持开放与选择权
企业不应被单一模型绑定。通过 Amazon Bedrock 等平台,企业可灵活接入包括智谱 GLM、MiniMax 在内的全球前沿模型,同时依托云原生 VPC 等技术确保数据隐私与安全。
数据层:构建 AI-ready 平台
传统数据平台主要服务于人,而新时代的数据平台必须服务好 AI Agent。这带来了新的挑战:
- 记忆管理:需解决数千个 Agent 并发时的记忆共享、隔离及长短期生命周期管理,避免知识冲突与串台。
- Token 效率:Token 消耗高的主因往往是喂给模型的无效信息过多。需优化上下文抽取,提升全链路可观测性。
- 架构开放:坚持开放数据架构(如 Iceberg、S3 Tables),避免厂商锁定,支持多模态数据湖及直接向量化存储(如 S3 Vectors)。
平台层:打造企业级 Harness
AI 不只是模型,更重要的是 Harness(驾驭层)。若将模型比作 CPU,Harness 则是操作系统与应用环境的集合,负责生产级的管控与调度。
Amazon Bedrock AgentCore 作为核心 Harness 产品,提供九大功能模块,分为三类:
- 运行支撑:Runtime 提供自动扩缩容,Memory 管理上下文,Code Interpreter 与 Browser 赋予执行能力。
- 系统集成:Identity 与 Gateway 集成 CRM、ERP 等现有系统,并继承员工真实权限,确保最小权限原则。
- 管控治理:通过 Policy、Evaluation 和 Observability 设定执行边界,评估结果并实现全过程可观测。
此外,通过与 OpenAI 合作推出的 Managed Agent,企业可直接复用前沿模型及最佳实践 Harness,兼顾灵活性与安全性。
Agent 应用的落地与展望
在应用层,Working Agent 将是下一个爆发点。其核心矛盾在于员工期望的“全能助手”与企业要求的“安全管控”之间的平衡。
通过深度个性化产品(如 Quick),可实现两者兼得:
总结而言,每一个应用都将被重构。企业需通过算力、模型、数据、平台及应用五层架构的协同迭代,将更好的模型与可信的数据结合,真正构建起生产级的 AI 能力,拥抱 Agent 时代。
— 完 —

