Token贵只因你喂给模型的垃圾太多了丨@亚马逊王晓野AIGC2026- 大数跨境

首页

Token贵只因你喂给模型的垃圾太多了丨@亚马逊王晓野AIGC2026

量子位

2026-05-30

导读：87%的企业部署了AI，真正赚到钱的只有10%

编辑部整理自 AIGC2026 | 量子位

当全民都在“养龙虾”时，真正的问题才刚刚浮现。

在刚结束的 2026 中国 AIGC 产业峰会上，亚马逊云科技产品技术部技术总监王晓野披露了一组关键数据：

87% 的企业宣称已大规模部署 AI，但真正从中获得生产价值的仅占 10%。

Demo 易做，难的是在企业生产环境中稳定运行。个人在 Mac mini 上运行 Agent 可随时重启，而让数千个 Agent 在企业分布式环境中安全、可信、不中断地运行，则是完全不同的工程复杂度。

演讲从硬核工程视角直击企业痛点：别再指望靠一个模型解决所有问题。从算力性价比、数据安全到 Agent 的记忆管理，每一层都是必须攻克的难题。

注：2026 中国 AIGC 产业峰会由量子位主办，线下参会超千人，线上直播观众近 400 万。

核心观点梳理

87% 的企业实现 AI 大规模部署，但仅 10% 获得实际生产价值。
个人场景与企业级场景的 Agent 落地存在本质差异。
AI 的核心不仅是大模型，拿掉模型后的 Harness（驾驭层）才是关键。
数据平台需从服务人转向服务 AI Agent。
Working Agent 的出现将真正颠覆过去 30 年的个人生产力模式。
Token 成本高往往源于信息冗余，而非单价过高。

企业级 Agent 落地的四大鸿沟

王晓野指出，尽管 Agent 产品与构建框架层出不穷，但能在生产环境大规模稳定运行的寥寥无几。企业跨越落地鸿沟需解决以下四大问题：

模型选择与响应速度

企业需兼顾性价比与敏捷性，能够灵活切换并快速响应日新月异的模型能力变化。

构建复杂度

分布式系统的长期稳定运行极具挑战。企业级 Agent 需具备自动重启、故障恢复及可信数据处理能力，这与个人开发环境的简易操作截然不同。

使用门槛

虽然工程师的使用门槛已降低，但营销、HR 等业务人员在实际应用中仍面临较高壁垒。

人才缺口

具备端到端推动 Agent 落地能力的复合型人才依然稀缺，平台部门需承担赋能整个组织的重任。

亚马逊云科技 CEO Matt Garman 曾指出，AI 和 Agent 带来了市场构建范式的巨变，应用将被重新改造。过去 30 年个人生产力未被真正颠覆，直到 Working Agent 的出现，工作方式才开始发生实质性改变。

数据显示，预计 2028 至 2030 年，超 15% 的企业日常决策将由 Agent 自主完成；2026 至 2028 年间，82% 的企业领导者计划增加“数字员工”比例。麦肯锡预测，Agent 及生成式 AI 带来的增量市场规模将从 2.6 万亿美元增至 4.4 万亿美元。

然而，高渗透率与低价值转化率并存。87% 的企业声称已大规模部署 AI，但真正产生价值的比例仅为 10% 左右。

从 Demo 走向生产的五大能力

要将 Agent 从 Demo 推向生产，企业 IT 平台需聚焦五大核心能力层级：

算力层：追求极致性价比

Agent 场景对推理算力的需求日益突出。通用芯片难以在所有场景提供最优性价比，企业应利用面向具体场景优化的专用芯片（如 Trainium、Graviton）来降本增效。

模型层：保持开放与选择权

企业不应被单一模型绑定。通过 Amazon Bedrock 等平台，企业可灵活接入包括智谱 GLM、MiniMax 在内的全球前沿模型，同时依托云原生 VPC 等技术确保数据隐私与安全。

数据层：构建 AI-ready 平台

传统数据平台主要服务于人，而新时代的数据平台必须服务好 AI Agent。这带来了新的挑战：

记忆管理：需解决数千个 Agent 并发时的记忆共享、隔离及长短期生命周期管理，避免知识冲突与串台。
Token 效率：Token 消耗高的主因往往是喂给模型的无效信息过多。需优化上下文抽取，提升全链路可观测性。
架构开放：坚持开放数据架构（如 Iceberg、S3 Tables），避免厂商锁定，支持多模态数据湖及直接向量化存储（如 S3 Vectors）。

平台层：打造企业级 Harness

AI 不只是模型，更重要的是 Harness（驾驭层）。若将模型比作 CPU，Harness 则是操作系统与应用环境的集合，负责生产级的管控与调度。

Amazon Bedrock AgentCore 作为核心 Harness 产品，提供九大功能模块，分为三类：

运行支撑：Runtime 提供自动扩缩容，Memory 管理上下文，Code Interpreter 与 Browser 赋予执行能力。
系统集成：Identity 与 Gateway 集成 CRM、ERP 等现有系统，并继承员工真实权限，确保最小权限原则。
管控治理：通过 Policy、Evaluation 和 Observability 设定执行边界，评估结果并实现全过程可观测。

此外，通过与 OpenAI 合作推出的 Managed Agent，企业可直接复用前沿模型及最佳实践 Harness，兼顾灵活性与安全性。

Agent 应用的落地与展望

在应用层，Working Agent 将是下一个爆发点。其核心矛盾在于员工期望的“全能助手”与企业要求的“安全管控”之间的平衡。

通过深度个性化产品（如 Quick），可实现两者兼得：

主动聚合：汇聚 CRM、邮件、聊天工具等多源任务，主动建议日程与行动。
打破边界：自动跨部门调用数据与资源，大幅缩短调研与协作时间。
持续进化：随着使用沉淀个人知识图谱，决策风格逐渐贴合用户习惯。

总结而言，每一个应用都将被重构。企业需通过算力、模型、数据、平台及应用五层架构的协同迭代，将更好的模型与可信的数据结合，真正构建起生产级的 AI 能力，拥抱 Agent 时代。

— 完 —

【声明】内容源于网络

量子位

各类跨境出海行业相关资讯

内容 16046

粉丝 1

量子位各类跨境出海行业相关资讯

总阅读242.0k

粉丝1

内容16.0k