今日凌晨1点,OpenAI举行技术直播,正式发布全球瞩目的GPT-5模型。
GPT-5采用全新三位一体架构
GPT-5首次引入内嵌式三位一体集成架构,由三大核心模块构成:处理常规任务的GPT-5-main模型、专攻复杂问题的GPT-5-thinking深度思考模型,以及负责实时决策的路由机制。此外,在额度用尽后将自动启用轻量版GPT-5-mini。
其中,路由机制是本次升级的核心创新,能根据对话类型、复杂度、工具需求及用户意图,智能调度最合适的模型响应,如同“交通指挥员”般优化资源分配。
该机制将持续通过用户行为数据(如模型切换记录、回应偏好与准确性反馈)进行训练,性能随时间不断进化。
性能全面超越前代,成为当前最强模型
OpenAI公布的测试数据显示,GPT-5在数学、编程、视觉理解及健康领域表现显著优于前代模型。
健康领域:准确率大幅提升
基于HealthBench评估体系,GPT-5-thinking在多项指标中领先,尤其在挑战性更强的HealthBench Hard测试中,得分从o3的31.6%提升至46.2%,刷新行业纪录。
数学能力:接近满分表现
在2025年美国AIME数学测试中,GPT-5无辅助工具得分为94.6%,启用Python后达99.6%,Pro专业版配合代码工具实现100%正确率,远超o3模型。
编码能力:SWE-bench测试登顶
在SWE-bench软件工程基准测试中,GPT-5开启思考模式后达到74.9%的解决率,超过o3的69.1%和GPT-4o的30.8%,成为当前最强代码生成模型。
直播中曾出现数据展示失误,误将o3与GPT-4o的图表高度标为一致,后续已修正。
安全性显著增强
在高风险场景下,GPT-5-thinking的幻觉率较o3降低超过8倍,错误率较GPT-4o下降逾50倍,并在全球健康背景适配中实现零失误。
应用场景广泛,开发效率飞跃
编码是GPT-5的核心优势之一,仅需简单提示即可快速构建完整应用。
例如输入“创建一个名为‘Jumping Ball Runner’的单页HTML游戏”,模型可在短时间内生成具备加速机制、最高分记录、重试功能和音效反馈的完整可运行程序。
还可用于快速制作交互式教学内容,如几分钟内生成解释伯努利效应的数百行代码演示。
GPT-5仅用5分钟完成财务分析模板开发,传统方式需数小时;也能轻松构建类塔防游戏或学习法语的互动应用,集成贪吃蛇玩法与语言学习元素。
无论是应用开发、图表绘制、代码解读还是AI Agent构建,GPT-5均展现出强大能力,使零代码基础用户也能高效实现创意落地。
训练数据与方法透明化
GPT-5延续OpenAI的数据策略,训练来源涵盖公开互联网信息、第三方合作数据及人工生成内容,并通过严格流程保障质量与安全。
采用先进过滤技术减少个人信息暴露,结合Moderation API与安全分类器,有效规避有害或敏感内容。
强化学习驱动“先思考再回答”
GPT-5-thinking系列模型采用强化学习技术,在输出前自动生成内部思维链,模拟多策略尝试并自我纠错,从而优化推理过程。
全面开放使用,分层接入
即日起,GPT-5面向Plus、Pro、团队及免费用户上线,企业与教育机构将在一周内获得访问权限。
Pro、Plus及团队用户可通过ChatGPT登录Codex命令行界面(Codex CLI)调用GPT-5进行编程。
免费用户可使用GPT-5,但有额度限制;达上限后将自动切换至功能精简但响应更快的GPT-5-mini版本。
Pro订阅者享有无限使用权限,并可访问更高阶的GPT-5 Pro版本;Plus与团队用户日常使用额度充足,适合组织级部署。
本文来源:公众号“AIGC开放社区”
责任编辑:张淑谦
审 核 人:曹新宇

