

OpenAI发布GPT-5，AI历史可能被改写

IT有得聊

2025-08-08

本文转载自“AIGC开放社区”

今日凌晨1点，OpenAI举行技术直播，正式发布全球瞩目的GPT-5模型。

GPT-5采用全新三位一体架构

GPT-5首次引入内嵌式三位一体集成架构，由三大核心模块构成：处理常规任务的GPT-5-main模型、专攻复杂问题的GPT-5-thinking深度思考模型，以及负责实时决策的路由机制。此外，在额度用尽后将自动启用轻量版GPT-5-mini。

其中，路由机制是本次升级的核心创新，能根据对话类型、复杂度、工具需求及用户意图，智能调度最合适的模型响应，如同“交通指挥员”般优化资源分配。

该机制将持续通过用户行为数据（如模型切换记录、回应偏好与准确性反馈）进行训练，性能随时间不断进化。

OpenAI公布的测试数据显示，GPT-5在数学、编程、视觉理解及健康领域表现显著优于前代模型。

基于HealthBench评估体系，GPT-5-thinking在多项指标中领先，尤其在挑战性更强的HealthBench Hard测试中，得分从o3的31.6%提升至46.2%，刷新行业纪录。

在2025年美国AIME数学测试中，GPT-5无辅助工具得分为94.6%，启用Python后达99.6%，Pro专业版配合代码工具实现100%正确率，远超o3模型。

在SWE-bench软件工程基准测试中，GPT-5开启思考模式后达到74.9%的解决率，超过o3的69.1%和GPT-4o的30.8%，成为当前最强代码生成模型。

直播中曾出现数据展示失误，误将o3与GPT-4o的图表高度标为一致，后续已修正。

在高风险场景下，GPT-5-thinking的幻觉率较o3降低超过8倍，错误率较GPT-4o下降逾50倍，并在全球健康背景适配中实现零失误。

编码是GPT-5的核心优势之一，仅需简单提示即可快速构建完整应用。

例如输入“创建一个名为‘Jumping Ball Runner’的单页HTML游戏”，模型可在短时间内生成具备加速机制、最高分记录、重试功能和音效反馈的完整可运行程序。

还可用于快速制作交互式教学内容，如几分钟内生成解释伯努利效应的数百行代码演示。

GPT-5仅用5分钟完成财务分析模板开发，传统方式需数小时；也能轻松构建类塔防游戏或学习法语的互动应用，集成贪吃蛇玩法与语言学习元素。

无论是应用开发、图表绘制、代码解读还是AI Agent构建，GPT-5均展现出强大能力，使零代码基础用户也能高效实现创意落地。

GPT-5延续OpenAI的数据策略，训练来源涵盖公开互联网信息、第三方合作数据及人工生成内容，并通过严格流程保障质量与安全。

采用先进过滤技术减少个人信息暴露，结合Moderation API与安全分类器，有效规避有害或敏感内容。

GPT-5-thinking系列模型采用强化学习技术，在输出前自动生成内部思维链，模拟多策略尝试并自我纠错，从而优化推理过程。

即日起，GPT-5面向Plus、Pro、团队及免费用户上线，企业与教育机构将在一周内获得访问权限。

Pro、Plus及团队用户可通过ChatGPT登录Codex命令行界面（Codex CLI）调用GPT-5进行编程。

免费用户可使用GPT-5，但有额度限制；达上限后将自动切换至功能精简但响应更快的GPT-5-mini版本。

Pro订阅者享有无限使用权限，并可访问更高阶的GPT-5 Pro版本；Plus与团队用户日常使用额度充足，适合组织级部署。

本文来源：公众号“AIGC开放社区”

责任编辑：张淑谦

审核人：曹新宇

【声明】内容源于网络

IT有得聊

1234

内容 1209

粉丝 0

IT有得聊 1234

总阅读7.6k

粉丝0

内容1.2k