Anthropic“过于先进，不予展示”的能力，被中国开源模型放出来了- 大数跨境

观网财经

2026-04-10

导读：4月7日，Anthropic官宣了新模型Claude Mythos Preview，但罕见的表示不对外发布。理由八个字就能说清：“过于先进，不予展示”。

（陈济深/张广凯）

4月7日，Anthropic发布Claude Mythos Preview模型，明确表示因技术先进性暂不对外公开。系统卡显示，Mythos在编码和网络安全领域实现代际领先：SWE-BenchPro测试达77.8分，较当前最强公开模型Claude Opus 4.6（57.3分）提升20个百分点。

过去两周，开发者体验持续下滑：3月23日Claude Code用户反馈额度异常消耗，经技术分析确认存在10-20倍token放大bug；4月5日Anthropic单方面终止Claude订阅对OpenClaw等第三方编码工具的支持；4月7日Mythos发布，普通用户无访问权限。

此前智谱于4月8日开源的GLM-5.1在SWE-BenchPro基准取得58.4分，超越Claude Opus 4.6及GPT-5.4（57.7分）、Gemini 3.1 Pro（54.2分）。该中国开源模型首次在Anthropic优势工程榜单实现反超。

美国闭源，中国开源

Anthropic公开报告显示，Mythos能自主发现23年未被发现的Linux内核漏洞、16年前FFmpeg遗留缺陷，甚至在无指令情况下突破安全沙箱并发布攻击细节。该公司为此启动1亿美元Project Glasswing项目，联合AWS等11家美国巨头封闭使用该模型。

GLM-5.1在同期安全能力取得突破性进展，CyberGym基准分数从48.3跃升至68.7，增幅42%。模型开源12小时内获370万阅读，HuggingFace等平台出现大量实践案例。美国分析机构Constellation Research指出，中国模型已主导开源赛道，美企在开源领域明显掉队。

GLM-5.1实现开源模型首次独立长时任务突破：工程师提交架构草图后离场，8小时内模型自主完成1200步操作，交付包含完整桌面环境、网络驱动及50余个应用的Linux系统，相当于四人团队周工作量。

该能力依赖先进任务编排系统（harness），此前此类工程设施仅Claude Code掌握。全球仅Claude Opus 4.6与GLM-5.1达成8小时任务完成时线，但前者存在额度限制及第三方工具中断风险，而GLM-5.1已在HuggingFace开源。

智谱通过三步验证国产算力可行性：1月GLM-Image成为首个全栈国产训练的SOTA级多模态模型；2月GLM-5完成七家国产芯片平台适配；4月GLM-5.1在华为昇腾优化后单节点性能逼近双卡国际集群。

当前国产算力训练成本仍高于国际方案，但实际部署效率正快速收敛。GLM系列已服务中国90%头部互联网企业，并部署于Google VertexAI、AWS Bedrock等海外平台。

伴随GLM-5.1发布，智谱将API价格上调10%，今年一季度累计涨幅达83%。腾讯云、阿里云等厂商同步调价，国产大模型行业集体进入涨价周期。值得关注的是，涨价期间智谱调用量逆势增长400%。

定价逻辑已从算力成本转向价值产出：Coding场景缓存价格与Claude Sonnet 4.6持平，标志国产模型首次在核心场景对标国际定价。资本市场积极反应，智谱股价单日最高涨18%，市值突破4000亿港元。

Anthropic将Mythos定向供给AWS等11家核心企业客户，反映其toB商业模式本质。企业级合同贡献主要营收，个人开发者产品仅为流量渠道，故对额度bug及工具限制反应迟钝。

相较之下，智谱在Mythos发布次日即开源GLM-5.1。开源模型实现性能反超证明：模型平权无需以牺牲顶尖能力为代价，开发者可自由集成于任意开源技术栈。

【声明】内容源于网络

观网财经

各类跨境出海行业相关资讯

内容 5201

粉丝 0

观网财经各类跨境出海行业相关资讯

总阅读41.9k

粉丝0

内容5.2k