大数跨境

GPT-5已发布,但支撑“真智能体”的基建还没跟上?Gartner泼了盆冷静水

GPT-5已发布,但支撑“真智能体”的基建还没跟上?Gartner泼了盆冷静水 洞见畏来
2025-08-15
2
导读:GPT-5这类模型已越来越强,但支撑“真正智能体(Agentic AI)”落地的核心基建,还远未建成。
Gartner 是全球领先的研究和顾问公司,成立于 1979 年,总部位于美国康涅狄格州斯坦福。作为标普 500 指数成分股公司,其 2024 年营收超 63 亿美元,拥有约 21,000 名员工,服务于全球近 90 个国家和地区的 15,600 个客户组织。

公司拥有 2,500 多位研究和咨询专家,提供研究、咨询、评测等服务,其 “魔力象限”“技术成熟度曲线” 等分析报告在业界极具权威性。Gartner 的客户涵盖全球 500 强中 73% 的企业,其研究成果和洞察对全球 IT 市场和数字经济的发展有着显著的指导和影响。

1956年美国高速公路系统诞生前,保时捷、法拉利等超跑已存在数十年——却只能在普通道路上“跑不快”。

Gartner杰出副总裁分析师Arun Chandrasekaran用这个类比,点出了当下AI行业的关键矛盾:GPT-5这类模型已越来越强,但支撑“真正智能体(Agentic AI)”落地的核心基建,还远未建成。即便GPT-5带来了进步,也只是“优秀的发动机”,而非能让AI发挥真正价值的“高速公路系统”。

一、GPT-5的3个核心进步:增量突破,而非革命性飞跃

Gartner承认,GPT-5在特定领域有明显提升,但整体仍属于“渐进式改进”,未达外界对OpenAI的高预期。其关键进展集中在三方面:

1. 编码能力大幅强化,瞄准企业软件工程

OpenAI明确将GPT-5的编码能力作为核心优势,直接对标Anthropic在该领域的领先地位。这一调整精准切入生成式AI在企业软件工程中的巨大需求,试图抢占关键场景市场。

2. 多模态能力扩展,打开企业集成新空间

除文本外,GPT-5在语音、图像等模态的处理上有显著进步。对企业而言,这意味着更多集成可能——比如将语音交互、图像分析融入现有业务系统,但需配套调整技术对接流程。

3. 智能体设计优化,但依赖企业系统适配

  • 工具调用升级:支持调用第三方API,还能“并行工具调用”(同时处理多任务),但要求企业系统能在单个会话中承载并发API请求,对现有架构是不小的考验;

  • 减少外部依赖:多步规划能力让更多业务逻辑可直接内置到模型中,降低了对外部工作流引擎的需求;

  • 上下文窗口扩容:免费用户8K、Plus用户(20美元/月)32K、Pro用户(200美元/月)128K。这能简化部分工作流——比如过去依赖复杂RAG(检索增强生成)绕过上下文限制的应用,现在可直接传入更大数据集。但Gartner提醒:RAG并未过时,“只检索最相关数据”仍比动辄传海量信息更高效、更省钱,未来更可能是“宽松检索+GPT-5处理复杂上下文”的混合模式。

二、GPT-5的成本与版本迭代:降价但有坑,旧版逐步淘汰

1. 价格优势明显,但需注意“输入输出比”

GPT-5大幅降低了API费用:输入token每百万1.25美元,输出token每百万10美元。这个价格不仅比肩Gemini 2.5,还远低于Claude Opus。

但需警惕一个细节:GPT-5的输入输出价格比高于前代模型。Gartner建议,企业若用它处理高token消耗场景(比如长文档分析),需提前测算总成本,避免“低价陷阱”。

2. 旧版GPT逐步淘汰,开发者需做3件事

OpenAI计划让GPT-5最终取代GPT-4o及“o系列”(此前曾宣布下架旧版,因用户反对暂恢复部分),并推出Pro、Mini、Nano三个尺寸,方便企业按“成本-延迟需求”分层选型——简单查询用小模型,复杂任务用全量模型。

但迭代背后有“隐性成本”,开发者需重点关注:

  • 输出格式、内存、函数调用逻辑的变化,可能需要Review代码并调整;

  • 部分前代模型的“ workaround(临时解决方案)”可能失效,需审计提示模板和系统指令;

  • OpenAI淘汰旧版的深层原因:自身算力紧张。目前其已与微软、甲骨文(Project Stargate)、谷歌等合作扩充算力,而维护多代模型会加剧基建成本与物理限制,淘汰旧版是必然选择。

三、Gartner的警告:GPT-5仍有风险,企业落地需做好4点

1. 幻觉减少但“ misuse风险”上升

OpenAI称GPT-5的幻觉率比前代降低65%,这能减少合规风险,更适合企业场景,且“思维链(CoT)解释”也利于审计和满足监管要求。

但矛盾的是:低幻觉+强推理+多模,也可能让GPT-5被用于生成更高级的诈骗、钓鱼内容。Gartner强调:即使抽样减少,关键工作流仍需人工审核,不能完全依赖模型。

2. 企业落地GPT-5的4条核心建议

  • 先试点再推广:在核心业务场景中试点,与其他模型做“side-by-side对比”,重点看准确率、速度、用户体验的差异;

  • 警惕数据暴露风险:比如“氛围编码(vibe coding)”这类做法可能泄露数据,需在不影响开发效率、不触发安全防护失效的前提下做好管控;

  • 升级治理体系:针对GPT-5的新特性(如更大上下文窗口、新模型行为)修订治理政策,校准监督机制;

  • 优化技术适配:测试工具集成、推理参数、缓存策略和模型尺寸,利用内置动态路由“让合适的模型做合适的事”;同时验证API配额、审计追踪、多模态数据管道,做好集成测试,确保能支撑新功能和更高吞吐量。

四、核心矛盾:智能体很火,但基建严重拖后腿

1. 智能体正处“期望膨胀顶峰”,即将进入“幻灭低谷”


在Gartner《2025生成式AI技术成熟度曲线》中,“智能体AI(Agentic AI)”是投资热点,但已处于“期望膨胀顶峰(Peak of Inflated Expectations)”——早期成功案例带来大量曝光,却也催生了不切实际的期待。


Gartner预测,接下来它很可能进入“幻灭低谷(Trough of Disillusionment)”:随着试点和落地失败增多,行业热情、投资会降温(回顾历史,1980年代以来已出现过两次AI寒冬)。

问题根源在于:厂商过度炒作,把产品包装成“可量产、适配企业、能快速创造价值”,但实际产品能力与预期差距极大。

2. 现状:智能体落地仅限“小众场景”,且不彻底

目前Gartner几乎没看到“全企业级”的智能体部署,仅在软件工程、采购等特定领域有少量应用,且这些应用“并非完全自主”——大多是人工驱动或半自动化。

3. 基建缺失是关键瓶颈,需突破3大障碍

要实现“真正的智能体”,企业需要的不只是更强的模型,而是一套完整的支撑体系,目前这三方面严重不足:

  • 工具与数据连接:智能体需要访问大量企业工具、数据存储和SaaS应用,但现有系统缺乏统一的对接能力;

  • 权限与安全管控:缺少完善的身份访问管理(IAM)系统,无法有效控制智能体的行为、访问范围(比如防止其获取敏感数据、个人身份信息);

  • 信息可信度保障:难以确保智能体输出的内容无偏见、无幻觉、无虚假信息,这对合规性要求高的行业(如金融、医疗)是致命问题。

Gartner建议,行业需合作制定“智能体-企业”“智能体-智能体”工具通信的开放标准,才能打破当前的“协同摩擦”。

五、未来:离AGI还很远,需一场“架构革命”

OpenAI的终极目标是AGI(通用人工智能),但GPT-5的发布让一个事实更清晰:我们离AGI还非常遥远

当前AI的局限很明显:

  • 推理能力有进步,但对物理世界的理解极弱——AI主要在数字世界运作,缺乏与物理世界的强交互接口(尽管空间机器人领域有改进,但仍处于极早期);

  • 靠“堆数据、堆算力”走不通:要实现AGI,不能只在现有技术曲线里迭代,而需要“模型架构或推理方式的革命”。


【声明】内容源于网络
0
0
洞见畏来
专注于前沿科技趋势,剖析底层算法逻辑,深耕商业化场景落地
内容 633
粉丝 0
洞见畏来 专注于前沿科技趋势,剖析底层算法逻辑,深耕商业化场景落地
总阅读228
粉丝0
内容633