01
引言
OpenAI 于美国时间2025年8月7日正式发布GPT-5 系列模型。该系列模型在推理、代码撰写、写作与安全性等多项关键指标上实现显著提升,并透过「统一系统」与「即时路由」自动调度最合适模型,优化使用者体验与运算效率。本文结合官方系统说明文件,对GPT-5 的核心构架、性能基准、开发者工具及安全机制进行更新与补充说明。
02
GPT-5系列模型与之前代号对照:
大致总结:
-
gpt-5-main / gpt-5-main-mini:快速、高吞吐率基础模型。
-
gpt-5-thinking / gpt-5-thinking-mini / gpt-5-thinking-nano:
-
gpt-5-thinking-pro:在ChatGPT 设定中启用并行测试时增强推理版本,主要提供给Pro、Team、Enterprise 及Edu 用户使用 。
上下文视窗与知识截止日期
上下文视窗:最高支持272,000个输入token,以及128,000个输出token,上下文处理上限达400,000token。
知识截止日期:gpt-5-main 家族于2024年9月30日前之数据训练;thinking 家族mini 与nano 版本于2024年5月30日前完成训练。
定价策略
输入成本显著降低(旨在鼓励长文本输入),但相较于GPT-4系列模型,GPT-5的输出费用有所提升。鉴于GPT-5性能全面超越O系列,且处于该价格区间,我们认为GPT-5系列模型具有最优性价比,建议优先选用。
统一系统与即时路由器
GPT-5 采用「统一系统」(unified system)构架,整合高吞吐率模型与深度推理模型,并由即时路由器(real‑time router)根据对话类型、复杂度、工具需求及使用者明示意图,自动选择最合适的运算引擎。一句提示如「think hard」即可触发深度推理模型。路由器持续基于用户切换行为、偏好评分与正确性指标训练更新;当使用量达上限时,将自动由mini 版本接手余下查询,以降低成本并维持服务可用性。
训练数据源信息
数据源:运用公开网络信息、与第三方合作伙伴取得之数据,以及用户或人类训练者/研究人员提供或生成之数据
严谨的数据处理与质量控管
建立严格的数据筛选流程,以维持数据质量并降低风险
采用先进的数据过滤技术,减少训练数据中的个人信息
结合Moderation API 与安全分类器,防止有害或敏感内容(如未成年相关性内容)进入训练数据
强化学习驱动的推理训练
gpt-5-thinking 系列(含mini、nano 版本)采用强化学习方式进行推理能力训练
模型在响应前会生成较长的「思考链(chain of thought)」,逐步优化策略并修正错误
透过此流程,模型可更好地遵循指引与安全政策,提高响应的实用度,同时减少被绕过安全规则的风险
03
精细化参数控制
verbosity:响应详细度,跟GPT-OSS 模型一样,可设定为low、medium、high。
reasoning_effort:推理强度,可设minimal 以跳过深度思考并获得快速响应。
AI Agent 任务与纯文字自定义工具
GPT-5 强化AI Agent 任务执行,支持数十个顺序或并行的工具调用,并准确遵循复杂指令。此外,GPT-5 推出了一种新的工具类型—自定义工具,允许GPT-5 使用纯文字而非JSON 格式呼叫工具。为了限制GPT-5 遵循自定义工具格式,开发者可以提供正规表示式,甚至是更完整的上下文无关语法。
以前,我们为开发者自定义工具提供的界面要求使用JSON 格式呼叫它们,然而,输出有效的JSON 格式需要模型完美转义所有引号、反斜线、换行符号和其他控制字元。尽管我们的模型训练有素,能够输出JSON,但在处理长输入(例如数百行代码或5页报告)时,出错的几率会逐渐增加。使用自定义工具,GPT-5 可以将工具输入写入纯文本,而无需转义所有需要转义的字元。
在SWE-bench 上,使用自定义工具而非JSON 工具进行验证后,GPT-5 的得分大致相同。
Python API调用示例
from openai import OpenAIclient = OpenAI()response = client.responses.create(model="gpt-5",input="Write a short bedtime story about a unicorn.")print(response.output_text)
GPT-5 示例程序作品集
网址:https://gpt5-coding-examples.vercel.app/
04
以下是OpenAI 官方所提供,有关GPT-5 系列和其他模型的benchmark 比较表,其中针对了六大类别去做比较:Intelligence, Multimodal, Coding, Instruction Following, Function Calling, Long Context 等
从上述图示中,可以了解到GPT-5 在核心智慧能力、指令遵循与代码开发三大方面展现领先优势。其逻辑与数学推理能够精准解析复杂问题,并能依据企业级需求灵活调整响应策略;指令遵循方面,不仅可高效解析多步骤指令,还能在多样化场景中保持一致性与稳定性;在软件开发流程中,GPT-5 的代码生成与问题诊断能力皆能显著缩短开发周期、提升团队生产力,成为技术团队不可或缺的协作伙伴。
同时,GPT-5 也在函数调用、超长上下文处理与多模态理解三大领域实现全面升级。它可无缝整合并调用企业内部API,支持复杂工作流程自动化;针对海量文本或长篇文件,能保持一致性与记忆连续性,强化知识管理与决策质量;更可同时解析文字、图像与影音等多种数据,提供跨媒介的智能洞察与创新应用,充分满足现代企业对高韧性AI 平台的需求。
05
GPT-5 系列通过「统一系统」与「即时路由」实现高吞吐与深度推理的动态平衡,并以高达400,000token的超大上下文窗口,突破了长文档处理与多步骤指令执行的瓶颈。
在智慧能力、代码撰写与指令遵循等核心指标上,GPT-5 不仅超越前代,并在函数调用、多模态理解与长上下文管理方面展现全方位优势;同时,gpt-5-thinking 系列在安全补全、幻觉率与欺瞒行为控制等方面,透过严苛测试达到业界领先水准,并以HealthBench、MMLU 及BBQ 等评测结果,验证了其在医疗对话、多语言处理与偏见抑制场景下的商业可用性与合规性。
点击上方小卡片关注我
添加个人微信,进专属粉丝群!

