点击蓝字 关注我们
在年度云计算盛会AWS re:Invent大会上,AWS Agentic AI的副总裁Swami Sivasubramanian宣布推出多项用于智能体(agent)开发的新工具。
Strands Agents SDK智能体框架增加了对TypeScript和边缘设备的支持,使智能体构建变得更加简单,并扩展应用至广泛的行业领域,如汽车、游戏、机器人等边缘领域。
Amazon Bedrock AgentCore智能体平台推出了多项创新功能,策略功能允许团队设定智能体使用工具的限制,评估功能帮助团队分析智能体在实际应用场景中的表现,而情景记忆功能使智能体能够从经验中学习,并在不断迭代中优化自身表现。
Amazon Bedrock全托管AI平台推出了强化微调功能,提供自动化的微调能力。
Amazon SageMaker AI平台则引入了模型定制功能,支持对模型进行深层次的底层调整,简化高效AI的构建流程。
同时,Amazon SageMaker HyperPod新增了无检查点训练功能,实现了大规模且低成本的训练,其整体目标是最大化客户在生产环境中工作负载的价值和投资回报率(ROI)。
此外,Amazon Nova Act服务的正式版本已全面上线,专注于提升智能体的可靠性,帮助实现智能体的大规模生产部署。
Strands Agents SDK 是一款开源的、以模型驱动的 AI 智能体框架,具备模型驱动的编排功能。自发布以来,其下载量已达到 529.9 万次。
亚马逊云科技宣布了两项新功能:首先,SDK 现已支持 TypeScript 的预览版。TypeScript 是全球备受欢迎的编程语言之一,这项支持将使全栈智能体应用的构建更加便捷。Strands Agents 对 TypeScript 的核心特性提供了全面支持,包括类型安全、async/await 异步语法以及现代 JavaScript/TypeScript 编程范式。开发者们可以使用 AWS CDK(云开发工具包),全程采用 TypeScript 来构建完整的智能体技术栈。
其次,SDK 现已支持边缘设备。用户可以通过 Strands Agents SDK,创建能够在小型设备上运行的自主 AI 智能体,从而在汽车、游戏、机器人等领域中实现智能体应用,在现实世界中交付智能化服务。
引入智能体到生产环境中面临众多挑战,需要快速地将智能体进行规模化部署,记录过去的交互和学习过程,管理和访问所有智能体和工具的控制,同时熟练使用工具以执行复杂的工作流,最后进行问题观察和调试。
然而,复杂性可能会阻碍创新的速度。如何帮助客户在大规模上构建和部署安全的生产级智能体?这正是Amazon Bedrock AgentCore的核心价值所在。
Amazon Bedrock AgentCore是一个专为安全和大规模构建与部署智能体而设计的平台,支持各种框架和模型。在今年7月的AWS纽约峰会上首次发布预览版,并在10月迅速迭代至全面可用。
为了让企业成功将智能体从原型过渡到生产环境,他们需要建立一种专用基础设施,该基础设施必须安全、可靠、可扩展,并能够适应智能体的非确定性特性。这意味着智能体需要一个能够动态扩展的底层支持系统,以承载长期的工作负载,同时还能即时、安全地存储和检索上下文信息。
然而,目前的早期采用者往往必须从头开始构建这样的基础设施,投入大量资源,导致整个过程既耗时又费力,严重延缓了开发周期。
Amazon Bedrock AgentCore正是为了解决这一挑战而推出的全托管服务,它集成了一系列关键组件,专为大规模生产级智能体的运行而设计,其中包括:
Runtime:提供无服务器、安全且隔离的计算资源;
Observability:提供可观测性工具(开源且兼容OpenTelemetry协议),帮助客户了解智能体的运行状态;
Memory:具备记忆功能,使智能体能够长期与用户互动,记住过去的交互内容,从而构建智能化、个性化的应用;
Code Interpreter:通过代码解释器,智能体能够编写代码以访问以前无法使用的工具;
Gateway:提供网关功能,支持连接AWS内部和外部系统;
Managed Browser与Identity:包括网络使用权限和身份认证功能,以明确智能体的身份及其代表的主体,并与治理和可观测性密切相关。
客户不仅可以使用Amazon Bedrock Agent来构建智能体,还可以结合任何开源智能体构建框架。目前,该平台已被广泛采用,开发者下载量已超过200万次。
Bedrock AgentCore新增三项新功能:
首先是AgentCore中的策略功能,它为智能体的操作设定了明确的边界。通过实时且独立于智能体代码的确定性控制,可以有效地拦截未经授权的操作。企业只需利用自然语言来描述规则,即可创建精细化的策略。
这些策略可以为智能体设定如访问的工具和数据、可执行的操作以及适用的条件等,这些策略会在智能体执行前进行评估,以确保智能体始终在设定的规则边界内运行。
其次是AgentCore的评估功能,它支持开发者通过智能体的行为进行持续质量检测,以确保其表现符合预期。
AgentCore的评估功能无需操心复杂的基础设施,提供了13种预置评估器,涵盖了正确性、实用性、工具选择准确性、安全性、目标达成率以及上下文相关性等常见质量维度。此外,开发者还可以灵活地使用自己偏好的大语言模型和提示,编写自定义评估器。
第三个功能是AgentCore的情景记忆功能,能够自动记录交互过程中的关键事件和状态,帮助智能体从过去的经验中学习,提高决策能力。
该功能包括短期记忆和长期记忆。短期记忆用于记录当前的交互过程,帮助智能体了解与用户或操作者的实时互动状态;而长期记忆则用于追踪长期的交互历史。在此基础上,情景记忆还能整合特定交互场景的上下文信息,使智能体能够提供更智能的建议。
这些功能的核心目标,都是加速智能体从想法到大规模生产落地的进程。
随着智能体应用的普及和模型在生产环境中规模的扩大,效率已经成为客户必须关注的核心问题。
企业客户在使用现成的模型时面临一个挑战:这些模型功能强大,但往往未针对效率和规模进行优化,导致不必要的成本支出、响应速度变慢以及资源浪费。效率不仅仅与成本有关,还涉及其他关键因素:延迟(智能体能否快速响应,实现实时互动)、扩展性(能否应对高负载的挑战)、敏捷性(能否根据应用的演进和客户的互动快速迭代调整)。
解决这一问题的关键在于定制化:通过定制小型专用模型,来处理智能体最常执行的任务,以更低的成本实现更快、更精准的响应。
亚马逊云科技推出Amazon Bedrock与Amazon SageMaker AI的新功能,以支持开发者使用先进模型定制技术。
Amazon Bedrock中的强化微调:通过强化微调功能Reinforcement Fine-Tuning(RFT),亚马逊云科技简化了模型定制流程,使客户即使没有深厚的机器学习和AI模型开发专业知识,也能提升模型准确率。与基础模型相比,该功能平均提升了66%的准确率,帮助客户利用更小、更快速、更具成本效益的模型,实现更优的结果,而无需依赖大型昂贵的模型。
发布初期,Amazon Bedrock强化微调功能将支持Amazon Nova 2 Lite模型,后续将逐步兼容更多模型。
在Amazon SageMaker AI进行模型自定义,通过该平台,模型运行速度更快、成本更低、准确性更高。亚马逊云科技在其用于大规模训练和模型定制的SageMaker AI平台中新增了Model Customization深度模型定制功能。客户无需管理底层基础设施,即可生成合成数据,从而提升应用效果。
亚马逊云科技提供了两种体验模式:
智能体驱动模式(预览版):这一模式通过智能体来引导开发者完成整个模型定制流程。开发者可以用自然语言描述需求,智能体将指导他们从生成合成数据到模型评估的每个步骤。
自主引导模式:这种模式适合那些喜欢自主操作并希望获得精细化控制和灵活性的开发者。开发者无需管理基础设施,可以选择适合的工具来定制技术,并调整相关参数,以实现个性化的控制。
无论选择哪种模式,开发者都可以应用先进的定制技术,如基于AI反馈的强化学习、带可验证奖励的强化学习、监督式微调和直接偏好优化。此外,SageMaker AI的新增功能将支持Amazon Nova以及Llama、Qwen、DeepSeek、gpt-oss等热门开源模型。
在与客户合作进行模型定制和训练的过程中,亚马逊云科技意识到仍有改进空间,因模型训练成本高且流程复杂。通常,客户需要使用大型GPU集群,这些集群的运行成本较高,而当它们闲置或出现故障时,损失更为严重,影响工作效率。
为解决这一问题,亚马逊云科技推出了Amazon SageMaker HyperPod。这是SageMaker中的一项托管训练功能,是目前降低大规模模型训练成本的最佳方案之一,可最大化集群的运行时间,实现训练和定制任务的最大价值。Amazon SageMaker HyperPod简化了模型训练与部署的基础设施管理,可将成本降低最高至40%。当训练规模扩展至数百或数千个加速器时,可能会遇到硬件或软件故障。
传统的依赖检查点的恢复方式可能耗时长达1小时,不仅代价高昂且占用存储资源,还可能导致价值数百万美元的计算集群在恢复过程中的闲置。对此,亚马逊云科技推出了SageMaker HyperPod的Checkpointless Training(无检查点训练)功能。该功能无需人工干预,能够在数分钟内自动从基础设施故障中恢复,使包含数万张AI加速器的集群训练效率最高可达95%。
对于大型长期运行的任务,重启和重跑往往是极为繁琐的。然而,无检查点训练技术的出现彻底改变了这一局面:系统会自动记录所有操作,一旦发生故障,能够在几分钟内迅速恢复,确保客户能够及时继续工作。当故障发生时,系统会自动替换受影响的组件,并通过从邻近正常加速器点对点传输模型和优化器状态来恢复训练。
这一机制大幅缩短了停机时间,不仅降低了整体运营成本,还能使客户更快地将定制模型部署到生产环境中。这一创新保证了无论客户的需求多么庞大,都能以简单、经济和可靠的方式完成训练。
在智能体应用和工作流部署生效后,可靠性成为了核心要求。尽管每个企业都有希望自动化的流程,但他们更需要的是可预测、可靠且可规模化的自动化,而这对企业自身而言往往难以实现。
为了简化这一过程,亚马逊云科技推出了一套端到端服务——Amazon Nova Act,旨在帮助开发者构建、部署和管理大量可靠的智能体,以实现生产环境中用户界面(UI)工作流程的自动化。
今年早些时候,亚马逊云科技发布了Amazon Nova Act的研究预览版。为了将智能体应用于生产环境,亚马逊打造了一个完全集成的解决方案,以实现可用于生产的可靠浏览器自动化。
今天,Amazon Nova Act的正式版已全面上线。该服务与Amazon Nova、Bedrock和AgentCore深度集成,使客户能够轻松构建高可靠性的智能体。它能够在大规模应用中提供超过90%的任务可靠性,同时相较于其他AI框架,能够更快速地实现价值,并简化部署过程。
客户可以在自己选择的任何开发环境中构建这些应用,系统支持同时部署大量并行的UI智能体,这些智能体依托模型,确保高可靠性。
Amazon Nova Act基于专门定制的Amazon Nova 2 Lite模型,能够高效驱动浏览器、支持API调用,并在需要时将问题升级至人工处理。该服务具备核心功能,包括Web质量保证(QA)测试、数据录入、数据提取以及结账流程等。
亚马逊云科技坚信生成式AI是人类正在经历的重要变革之一。提供安全、高弹性的基础架构和丰富的AI功能,以帮助客户实现业务转型,并推动这一技术在未来几个月和几年内的广泛应用。
Tel丨021-33680778
Mail丨marketing@qinchengsoft.com

