不再是穷鬼平替！OpenAI 最强「赛博牛马」，来了。- 大数跨境

首页

不再是穷鬼平替！OpenAI 最强「赛博牛马」，来了。

AI信息Gap

2026-03-18

导读：小模型，大牛马。

小模型，大牛马。

12天。

3月5日，OpenAI发布GPT-5.4 Pro（超大杯）与GPT-5.4 Thinking（大杯）；3月17日，正式上线GPT-5.4 mini（中杯）与GPT-5.4 nano（小杯）。

GPT-5.4系列全面对标竞品

OpenAI本次发布强调性能与成本双重优势：横向超越前代GPT-5 mini，纵向对标Anthropic Claude Haiku 4.5与谷歌Gemini 3 Flash。

MCP Atlas测试：AI工具调用能力

GPT-5.4 nano达56.1%，Claude Haiku 4.5为34.6%。nano输入价格仅0.2美元/百万token，为Haiku 4.5（1美元）的1/5，性能高出21个百分点。

OSWorld电脑操作测试

GPT-5.4满血版得分75.0%，首次超越人类基准；mini达72.1%，接近满血版；Haiku 4.5为50.7%。

Terminal-Bench终端编程测试

GPT-5.4 mini得分为60.0%，Haiku 4.5为41.0%，Gemini 3 Flash为47.6%。mini输入价格0.75美元/百万token，比Haiku 4.5低25%。

GPQA Diamond专家推理测试

Gemini 3 Flash以90.4%领先，GPT-5.4 mini为88.0%，显示谷歌在纯推理任务上仍有优势。

Codex子代理功能全面支持mini与nano

Codex「Subagents」（子代理）功能已向GPT-5.4 mini与nano开放。开发者可组合调用不同模型分工协作——例如在代码审查中，由GPT-5.4负责核心逻辑与安全分析，GPT-5.4 mini处理文档核查，GPT-5.3 Codex Spark执行代码库扫描，最多并行运行6个子代理。

mini消耗配额仅为GPT-5.4的30%，单位成本下算力利用率显著提升。