大数跨境

不再是穷鬼平替!OpenAI 最强「赛博牛马」,来了。

不再是穷鬼平替!OpenAI 最强「赛博牛马」,来了。 AI信息Gap
2026-03-18
9
导读:小模型,大牛马。

小模型,大牛马。

12天。

3月5日,OpenAI发布GPT-5.4 Pro(超大杯)与GPT-5.4 Thinking(大杯);3月17日,正式上线GPT-5.4 mini(中杯)与GPT-5.4 nano(小杯)。

GPT-5.4系列全面对标竞品

OpenAI本次发布强调性能与成本双重优势:横向超越前代GPT-5 mini,纵向对标Anthropic Claude Haiku 4.5与谷歌Gemini 3 Flash。

MCP Atlas测试:AI工具调用能力

GPT-5.4 nano达56.1%,Claude Haiku 4.5为34.6%。nano输入价格仅0.2美元/百万token,为Haiku 4.5(1美元)的1/5,性能高出21个百分点。

OSWorld电脑操作测试

GPT-5.4满血版得分75.0%,首次超越人类基准;mini达72.1%,接近满血版;Haiku 4.5为50.7%。

Terminal-Bench终端编程测试

GPT-5.4 mini得分为60.0%,Haiku 4.5为41.0%,Gemini 3 Flash为47.6%。mini输入价格0.75美元/百万token,比Haiku 4.5低25%。

GPQA Diamond专家推理测试

Gemini 3 Flash以90.4%领先,GPT-5.4 mini为88.0%,显示谷歌在纯推理任务上仍有优势。

Codex子代理功能全面支持mini与nano

Codex「Subagents」(子代理)功能已向GPT-5.4 mini与nano开放。开发者可组合调用不同模型分工协作——例如在代码审查中,由GPT-5.4负责核心逻辑与安全分析,GPT-5.4 mini处理文档核查,GPT-5.3 Codex Spark执行代码库扫描,最多并行运行6个子代理。

mini消耗配额仅为GPT-5.4的30%,单位成本下算力利用率显著提升。

“别死磕一个模型了。大模型思考,小模型干脏活累活。”

AI开发正从单模型驱动转向多模型协同的“团队作业”模式。

用户可用性与部署策略

ChatGPT免费版及Go用户现已可在加号菜单中选择「思考(Thinking)」模式,调用GPT-5.4 mini,支持400K上下文窗口。

ChatGPT Plus与Pro用户默认享有GPT-5.4 Thinking调用权限(Plus限3000次/周,Pro无限)。

GPT-5.4 nano仅开放API接口,不接入ChatGPT界面,定位为开发者级轻量工具,适用于分类、数据清洗、排序等高吞吐、低复杂度任务,输入成本仅0.2美元/百万token。

三月密集发布:小模型战略升级

OpenAI在3月12天内连续推出GPT-5.4 Pro、GPT-5.4 mini、GPT-5.4 nano三款模型,完成从旗舰到边缘的全栈覆盖。

小模型角色已发生本质转变:从过去作为大模型的“低成本平替”,进化为协同生态中的“高效执行单元”——即“赛博牛马”。

【声明】内容源于网络
0
0
AI信息Gap
各类跨境出海行业相关资讯
内容 746
粉丝 0
AI信息Gap 各类跨境出海行业相关资讯
总阅读39.5k
粉丝0
内容746