OpenAI 正式发布了代号"Spud"的 GPT-6,性能暴涨40%。然而同一时间,中国开发者的真正热情,已经转向了另一个名字——通义千问 Qwen3.6-Plus。
上线 OpenRouter 仅24小时,单日调用量突破 1.4万亿Token,暴涨711%,直接登顶全球日榜榜首,打破平台历史纪录。更重要的是,在 CodeArena 编程榜单中,千问3.6-Plus 排名全球第二——超越 GPT-5.4 和 Gemini 3.1,成为榜单上排名最高的中国大模型。
一、GPT-6发布,但中国开发者已经在追千问了
4月14日,OpenAI 正式发布 GPT-6。这是全球最受瞩目的 AI 发布,代号"Spud(土豆)",Symphony 架构,200万 Token 上下文,性能提升 40%。
然而,如果你问问国内的 AI 开发者们最近在讨论什么,答案很可能不是 GPT-6——而是千问 3.6。
以前每次 OpenAI 发新模型,国内开发者熬夜追。
现在不一样了。千问 3.6 刚在编程榜单 CodeArena 上拿了全球第二。
GPT-6?好像一个明星开了演唱会,但粉丝已经散场了。
二、CodeArena 全球第二:中国AI的历史性时刻
4月3日,全球知名大模型盲测榜单 LMArena 旗下 CodeArena 公布了新一期排名。
千问 3.6-Plus 综合得分紧追 Claude Opus 4.6-Thinking,排名全球第二,超越 GPT-5.4 Thinking、GPT-5.0-high 和 Gemini 3.1 Ultra。
这是中国大模型在编程能力领域取得的历史最高排名,也是该榜单上排名最高的中国模型。
值得注意的是,千问 3.6-Plus 采用混合稀疏 MoE 架构,以不到竞品 1/3 的参数量,实现了超越 2-3 倍参数量竞品的性能。彻底打破了"参数越大越强"的行业迷信。
三、1.4万亿 Token:OpenRouter 史上最强新模型
4月2日晚,千问 3.6-Plus 正式版上线全球最大 AI 模型 API 聚合平台 OpenRouter。
仅仅24小时后:
-
单日调用量突破 1.4万亿 Token -
涨幅高达 711% -
打破 OpenRouter 单日单模型调用量全球历史纪录 -
拿下近 30% 市场份额
这是 OpenRouter 有史以来最强劲的新模型表现。
——OpenRouter 官方评价
OpenRouter 的排名依据是"真金白银"的 Token 消耗,这意味着这不是评测机构打出来的分数,而是全球开发者用真钱投出来的认可。
四、凭什么屠榜?三大核心能力
- 百万级超长上下文
:默认支持 100万 Token,约等于 75万字,一次性处理整本技术书籍或整个代码仓库 - Agentic Coding 全链路自动化
:一句话需求 → 架构设计 → 代码生成 → 自测修复 → 部署上线,Terminal-Bench 2.0 全球第一(61.6分) - 原生多模态
:图文/视频理解,在 215 项任务中取得 SOTA 表现
SWE-Bench Verified 得分 78.8 分,逼近 Claude Opus 4.5,真实项目修复能力拉满。
五、从跟跑到领跑:中国AI的历史性转折
回顾中国 AI 大模型的发展历程,从最初的追赶者,到逐渐缩小差距,再到今天在编程领域实现领跑,这个转变发生得非常快。
-
千问 3.6 的成功证明:小参数 + 高效率 = 强性能,不再需要千亿、万亿参数的"军备竞赛" - 国产 AI 已摆脱技术依附
,在核心编程领域实现弯道超车 - 商业化领跑
:OpenRouter 的真实调用数据证明,中国 AI 模型已被全球开发者广泛使用
千问 3.6-Plus 不是开源模型——阿里已从开源生态向商业化旗舰模型转型,仅通过 API 提供服务。这也意味着中国 AI 大模型正式进入商业化"领跑"阶段。
总结
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|

