这是re:Invent 2025上,亚马逊云科技展示的内部使用Kiro autonomous agent的实际效果。这个AI Agent与开发流程并行运作,自动化完成从功能交付、缺陷分类到提升代码覆盖率等一系列任务,它像资深开发者一样工作,但效率是人的数倍。
12月初,拉斯维加斯的re:Invent 2025上,亚马逊云科技CEO Matt Garman站在台上,给出了一个判断:“Agentic AI技术正处于关键转折点,从‘技术奇迹’转变为能提供实际业务价值的实用工具。”他预计,未来将有数十亿Agents在各行各业广泛运行,帮助企业实现10倍效率提升。
"Amazon is the best place to build & run agents" ——舞台背景屏幕上的这句宣言 ,揭⽰了亚马逊云科技在AI竞赛中的差异化打法。与单纯追求模型参数规模的竞争对手不同 ,其Agent战略直指企业最核心的痛点:如何让AI从演⽰Demo转化为真正的生产力工具。
自主决策、横向扩展、长时运行——这三大特征重新定义了AI Agent的能力边界。通过发布
Amazon Bedrock AgentCore套件 ,亚马逊云科技将构建Agent的技术门槛降至"平民级" :开发者无需从零搭建复杂的记忆系统 ,只需调用AgentCore Memory模块即可实现上下文持久化;借助Code Interpreter工具 ,Agent能直接操作代码环境完成数据分析;而Managed Browser则赋予其浏览网页、操作SaaS应用的实体能力。
最令人震撼的是Kiro autonomous agent的实战效果:亚马逊云科技内部项目数据显⽰ ,原本需要30人18个月完成的开发任务 ,在Agent辅助下仅6人76天就达成目标。 "它像资深开发者一样审阅代码、修复漏洞、生成测试用例 ,但效率是人类的数倍" ,Garman在演讲中强调 ,这种"数字员工"正在重新定义企业的组织形态。
行业分析师指出 ,Agent技术的革命性在于将AI的价值创造模式从"被动响应"转向"主动执行 "。当传统RPA只能处理结构化流程时 ,新一代Agent已能应对需要推理判断的复杂场景:从索尼 Data Ocean每天15万次的合规审查 ,到S&P Global将应用部署时间从几周压缩至几分钟 ,这些案例印证了Garman的判断——Agentic AI正处于从"技术奇迹"到"实用工具"的关键转折点。
在AI商业化的进程中 ,算力成本始终是悬在企业头上的达摩克利斯之剑。re:Invent大会上 ,亚马逊云科技用一组数据揭⽰了行业痛点:训练一个千亿参数模型的成本高达数百万美元 ,而推理费用占AI项目总支出的70%以上。面对这一困境 ,其自研芯片家族给出了令人振奋的解决方案。
能效比——这个看似普通的指标 ,成为亚马逊云科技芯片战略的核心锚点。最新发布的Traini um3 UltraServers搭载3纳米工艺AI芯片 ,实现了计算能力4.4倍、 内存带宽3.9倍的跨越式提升。
更关键的是 ,其每兆⽡算力处理的AI token数量较上一代提升5倍 ,在运行GPT-OSS- 120B模型时 ,单位能耗产出的token数达到行业平均水平的3倍以上。
"当每⽡特电力能处理更多任务时 ,AI的规模化应用才具备经济可行性" ,亚马逊云科技芯片部门负责人在技术分论坛上解释道。这种能效优势来源于架构创新:Traini um3采用3D堆叠封装技
术 ,将内存与计算单元的物理距离缩短40% ,配合新型张量计算核心 ,实现了计算密度与能效比的双重突破。
而更令人期待的是已公布研发计划的Traini um4 ,其承诺将实现6倍FP4计算性能、4倍内存带宽和2倍高内存容量。通过这种"制程迭代+架构优化"的双轮驱动 ,亚马逊云科技正构建起难以复制的算力成本壁垒——数据显⽰ ,采用其自研芯片的客户 ,AI训练成本平均降低45% ,推理延迟减少30%。
技术的价值最终需要商业实践来验证。在re:Invent大会的客户案例环节,索尼与S&P Global的实践展⽰了AI Agent如何在不同行业创造颠覆性价值,这些真实数据比任何技术参数都更具说服力。
索尼DataOcean:每天760TB数据的智能治理革命
对于拥有500多个数据源、每天处理760TB数据的索尼DataOcean平台而言,合规审查曾是最令人头疼的难题。"传统人工审核不仅耗时,还存在30%的错误率" ,索尼CTO在演讲中坦言。而在部署基于AmazonBedrock构建的定制Agent后,这一局面彻底改变:
.效率提升100倍:合规审查从平均48小时缩短至28分钟
.用户规模57000人:覆盖索尼全球各业务线的数据分析师
. 日处理请求15万次:92%的常规查询无需人工介入
通过微调AmazonNova2Lite模型,Agent能精准理解索尼内部的合规规则,并自动生成审计报告。更值得关注的是其自学习能力——系统会记录人工修正的案例,不断优化判断逻辑,使准确率从初期的78%提升至99.2%。
S&P Global:金融科技的分钟级部署革命
在风险控制严苛的金融行业,S&PGlobal的Astra平台创造了另一个奇迹。这个基于Amazon BedrockAgentCore构建的Agentic工作流系统,将新应用部署时间从"几周"压缩至"几分钟",而这背后是对金融行业合规要求的深度解构。