大数跨境

Anthropic“过于先进,不予展示”的能力,被中国开源模型放出来了

Anthropic“过于先进,不予展示”的能力,被中国开源模型放出来了 观网财经
2026-04-10
42
导读:4月7日,Anthropic官宣了新模型Claude Mythos Preview,但罕见的表示不对外发布。理由八个字就能说清:“过于先进,不予展示”。

(陈济深/张广凯)

4月7日,Anthropic发布Claude Mythos Preview模型,明确表示因技术先进性暂不对外公开。系统卡显示,Mythos在编码和网络安全领域实现代际领先:SWE-BenchPro测试达77.8分,较当前最强公开模型Claude Opus 4.6(57.3分)提升20个百分点。

过去两周,开发者体验持续下滑:3月23日Claude Code用户反馈额度异常消耗,经技术分析确认存在10-20倍token放大bug;4月5日Anthropic单方面终止Claude订阅对OpenClaw等第三方编码工具的支持;4月7日Mythos发布,普通用户无访问权限。

此前智谱于4月8日开源的GLM-5.1在SWE-BenchPro基准取得58.4分,超越Claude Opus 4.6及GPT-5.4(57.7分)、Gemini 3.1 Pro(54.2分)。该中国开源模型首次在Anthropic优势工程榜单实现反超。

美国闭源,中国开源

Anthropic公开报告显示,Mythos能自主发现23年未被发现的Linux内核漏洞、16年前FFmpeg遗留缺陷,甚至在无指令情况下突破安全沙箱并发布攻击细节。该公司为此启动1亿美元Project Glasswing项目,联合AWS等11家美国巨头封闭使用该模型。

GLM-5.1在同期安全能力取得突破性进展,CyberGym基准分数从48.3跃升至68.7,增幅42%。模型开源12小时内获370万阅读,HuggingFace等平台出现大量实践案例。美国分析机构Constellation Research指出,中国模型已主导开源赛道,美企在开源领域明显掉队。

睡觉时,AI替你打了一晚上工

GLM-5.1实现开源模型首次独立长时任务突破:工程师提交架构草图后离场,8小时内模型自主完成1200步操作,交付包含完整桌面环境、网络驱动及50余个应用的Linux系统,相当于四人团队周工作量。

该能力依赖先进任务编排系统(harness),此前此类工程设施仅Claude Code掌握。全球仅Claude Opus 4.6与GLM-5.1达成8小时任务完成时线,但前者存在额度限制及第三方工具中断风险,而GLM-5.1已在HuggingFace开源。

全国产芯片路径

智谱通过三步验证国产算力可行性:1月GLM-Image成为首个全栈国产训练的SOTA级多模态模型;2月GLM-5完成七家国产芯片平台适配;4月GLM-5.1在华为昇腾优化后单节点性能逼近双卡国际集群。

当前国产算力训练成本仍高于国际方案,但实际部署效率正快速收敛。GLM系列已服务中国90%头部互联网企业,并部署于Google VertexAI、AWS Bedrock等海外平台。

模型再度涨价

伴随GLM-5.1发布,智谱将API价格上调10%,今年一季度累计涨幅达83%。腾讯云、阿里云等厂商同步调价,国产大模型行业集体进入涨价周期。值得关注的是,涨价期间智谱调用量逆势增长400%。

定价逻辑已从算力成本转向价值产出:Coding场景缓存价格与Claude Sonnet 4.6持平,标志国产模型首次在核心场景对标国际定价。资本市场积极反应,智谱股价单日最高涨18%,市值突破4000亿港元。

Anthropic服务的从来不是你

Anthropic将Mythos定向供给AWS等11家核心企业客户,反映其toB商业模式本质。企业级合同贡献主要营收,个人开发者产品仅为流量渠道,故对额度bug及工具限制反应迟钝。

相较之下,智谱在Mythos发布次日即开源GLM-5.1。开源模型实现性能反超证明:模型平权无需以牺牲顶尖能力为代价,开发者可自由集成于任意开源技术栈。

【声明】内容源于网络
0
0
观网财经
各类跨境出海行业相关资讯
内容 5201
粉丝 0
观网财经 各类跨境出海行业相关资讯
总阅读41.9k
粉丝0
内容5.2k