亚马逊云科技re:Invent 2025:Amazon Bedrock AgentCore重磅升级
re:Invent 2025期间,亚马逊云科技宣布Amazon Bedrock AgentCore(仅面向海外业务)多项核心功能升级,助力企业安全、高效地规模化部署AI Agent。自2025年7月预览版发布以来,AgentCore SDK下载量已突破200万次,广泛应用于体育、SaaS、零售等多个行业。
典型应用案例
- PGA TOUR:基于AgentCore构建多Agent内容生成系统,内容撰写效率提升10倍,成本降低95%。
- Workday:依托AgentCore Code Interpreter实现自然语言驱动的财务数据分析,规划分析耗时缩短30%,每月节省约100小时。
- Grupo Elfa:通过AgentCore Observability实现Agent决策100%可追溯,问题解决时间缩短50%,销售团队日均处理数千份报价请求。
Agent规模化部署的核心挑战与应对
随着企业加速Agent落地,如何设定合理运行边界、保障数据安全与决策合规,成为关键瓶颈。Agent的自主性既是优势,也带来风险——可能越权访问敏感数据、执行未授权操作或偏离预期目标。
AgentCore全新能力体系聚焦“可信部署”,从策略管控、质量评估、经验学习与交互优化四方面系统性解决上述难题:
Policy in AgentCore(预览版)
通过细粒度权限策略,在AgentCore Gateway工具调用前实时拦截校验,为Agent行为划定明确边界。策略独立于Agent推理流程,与Gateway深度集成,兼顾安全性与响应速度。
AgentCore Evaluations(预览版)
全托管质量评估服务,支持内置评估器(准确性、实用性、安全性、上下文相关性等)与自定义模型评分。评估结果实时同步至Amazon CloudWatch,支持设置阈值警报,覆盖测试与生产全周期。
AgentCore Memory 情景记忆功能
新增长期策略机制,使Agent能从历史交互中学习并优化后续决策。系统自动提取结构化情景片段,经反思Agent提炼通用规律,显著提升任务一致性与个性化服务能力。
AgentCore Runtime 双向流式传输功能
支持语音Agent实现自然流畅的实时对话:用户可在Agent回复过程中随时打断,Agent即时适配新意图,保持上下文连贯性,大幅降低复杂对话系统的开发门槛。
Policy in AgentCore:精准管控Agent
Policy功能将Agent视为具备自主决策能力的主体,所有工具调用必须通过策略验证后方可执行。用户既可用自然语言描述规则(系统自动生成并验证Cedar策略),也可直接编写Cedar代码,无需定制开发即可完成策略配置、审计与复用。
策略规则完全解耦于Agent构建方式与底层模型,可统一定义Agent可访问的工具(API、Lambda函数、MCP服务器、第三方服务)、可执行操作及触发条件。一次配置,全企业复用,开发者可专注体验创新,企业可放心推进规模化部署。
Policy使用指南
在AgentCore控制台“Policy”模块中创建策略引擎,并关联一个或多个AgentCore Gateway。策略引擎支持强制执行(允许/拒绝调用)或仅日志模式,便于灰度验证。
创建策略时,可基于JWT token中的OAuth声明(如role)与工具调用参数(如context.input.amount)设定条件。例如:仅限role为refund-agent且退款金额低于200美元的用户调用退款工具。
permit(
principal is AgentCore::OAuthUser,
action == AgentCore::Action::"RefundTool__process_refund",
resource == AgentCore::Gateway::"<GATEWAY_ARN>"
)
when {
principal.hasTag("role") &&
principal.getTag("role") == "refund-agent" &&
context.input.amount < 200
};
左右滑动查看完整示意
AgentCore Evaluations:实现持续、实时的质量洞察
AgentCore Evaluations提供开箱即用的多维评估能力,涵盖正确性、帮助性、工具选择准确率、目标成功率、安全性等通用指标,并支持基于业务场景定制提示词与评分模型。
评估数据自动采集、实时打分,结果与Observability洞察统一集成至Amazon CloudWatch仪表盘。支持按采样率与过滤条件灵活配置任务,权限可复用现有IAM角色。
客服Agent典型评估维度
- 准确性:回复信息是否符合事实;
- 忠实度:回复是否有上下文或数据源支撑;
- 实用性:是否对用户真正有用;
- 危害性:是否存在有害内容;
- 刻板印象:是否含针对特定群体的笼统表述。
工具选择与参数提取类评估器,可验证Agent是否选用合适工具并准确解析用户意图。
自定义评估器创建流程
指定评估模型、配置温度系数与最大输出Token数,输入定制化提示词(可修改内置模板或全新编写);定义评分量级(数值或文本标签);设定计算范围(单条追踪、完整会话或单次工具调用)。
AgentCore Memory:支持Agent基于经验自主学习
AgentCore Memory新增长期记忆策略,使Agent能持续学习用户偏好与任务规律。例如:多次为差旅Agent指定会议后返程弹性调整,系统将自动归纳该模式,在后续类似场景中主动推荐适配方案。
该功能通过结构化记录上下文、推理链、动作与结果,并由反思Agent提炼通用逻辑,减少对冗长指令的依赖,提升响应精度与个性化水平。
AgentCore Runtime:实现更自然流畅的对话交互
双向流式传输功能使语音Agent具备实时倾听与动态响应能力,用户无需等待Agent完整回复即可插话,Agent即时切换上下文,形成接近人类交流节奏的对话体验。
该功能抽象了底层并发通信与状态管理复杂性,开发者仅需几行代码即可构建高可用、低延迟的语音交互Agent,显著提升终端用户体验与开发效率。
适用区域与兼容性
AgentCore Policy预览版已上线区域包括:美国东部(俄亥俄州、北弗吉尼亚州)、美国西部(俄勒冈州)、亚太地区(孟买、新加坡、悉尼、东京)及欧洲地区(法兰克福、爱尔兰)。
AgentCore Evaluations预览版已上线区域包括:美国东部(俄亥俄州、北弗吉尼亚州)、美国西部(俄勒冈州)、亚太地区(悉尼)及欧洲地区(法兰克福)。
AgentCore采用按量付费模式,无前期承诺;新用户可享免费套餐,快速上手。服务兼容CrewAI、LangGraph、LlamaIndex、Strands Agents等主流开源框架,支持任意基础大模型,支持组合使用或独立部署,并提供开源MCP服务器,适配主流AI辅助开发环境。


