最强黑客大模型，不再是Mythos- 大数跨境

新智元

2026-05-15

导读：黑马已上位。

新智元报道 编辑：艾伦

【新智元导读】微软通过多Agent系统MDASH在AI漏洞发现的权威基准测试CyberGym登顶，得分88.45%，超过Anthropic最强模型Mythos五个百分点。微软未依赖自有前沿模型，而是调度公开可用模型构建系统，揭示系统工程对单一模型优势的颠覆性价值。

微软MDASH系统领跑AI安全测试

5月12日，微软发布的MDASH AI安全系统以88.45%的成绩登顶CyberGym基准测试榜首，领先Anthropic的Mythos Preview（83.1%）和OpenAI的GPT-5.5（81.8%）。微软并未使用自有前沿模型，而是整合市面上公开可用的第三方模型，通过100多个专业化Agent分工协作，实现了比单一模型更高的漏洞检测效率。

该系统已成功挖掘出Windows 11系统的16个高危漏洞，包括可导致远程蓝屏的CVE-2026-33827等。其关键突破在于：通过任务分解（准备→扫描→验证→去重→证明）和模型调度策略，让轻量级模型处理高频验证任务，大模型专注深度推理，形成工程驱动的效能优势。

解析CyberGym基准测试

CyberGym由加州大学伯克利分校团队开发（论文发表于ICLR 2026），是当前AI安全评估最权威的公开基准之一。测试基于1507道真实开源项目题目，要求AI分析含漏洞代码并编写攻击验证代码。

Anthropic、OpenAI、Meta等公司均提交过测试结果。需注意的是，榜单成绩由企业自行提交，虽基准代码开源但缺乏独立第三方验证。测试直接映射AI的实战能力：能否可靠发现漏洞并证明其可利用性。

多Agent系统的工程优势

MDASH的核心启示在于：系统设计能有效抹平模型差距。Anthropic与OpenAI投入巨额资源训练的Mythos和GPT-5.5虽为安全领域顶尖模型，却被微软用其自身公开模型构建的系统超越。

MDASH采用非绑定架构，"模型仅是输入之一"。新模型上线后只需配置更新，既有工程资产全可复用。例如：审计Agent与辩论Agent分离执行，模型分歧转化为纠错信号。这种系统层竞争力构成新型威胁——模型优势可能因工程整合失效。

AI安全发展的双路径竞争

通往强人工智能（ASI）的路径正呈现分化：

模型极致化路径：以Anthropic和OpenAI为代表，依赖海量算力训练单一顶尖模型（如仅限小范围测试的Mythos）；
系统整合路径：以微软MDASH为范例，通过100+Agent任务分解发挥现有模型最大价值。

MDASH证实系统路径在安全领域可行，但其底层仍依赖模型公司的技术突破。若模型进步停滞，系统能力也将触及天花板。

从实验室到实战的验证

MDASH团队由DARPA网络安全挑战赛冠军Team Atlanta组建，其技术已落地微软内部流程：

发现4个Windows Critical级远程代码执行漏洞，均通过5月补丁星期二修复；
对核心组件clfs.sys五年历史漏洞召回率达96%，tcpip.sys达100%；
工具将直接提升补丁规模——微软明确表示后续安全更新将持续扩大。

实战数据证明，AI漏洞挖掘已超越跑分阶段。需警惕的是，攻击者同样可利用公开模型实现类似技术，零技术门槛的漏洞利用时代正在加速到来。

行业影响与应对方向

MDASH的核心价值在于验证关键趋势：构建模型上层系统正与训练强模型具有同等战略意义。

对模型公司：模型领先不等同商业优势，开放API可能使对手在其核心领域反超；
对平台企业：即便缺乏顶尖模型，深入领域工程（如Agent分工设计、验证流水线）仍可构建护城河；
对终端用户：及时安装安全补丁成为必要防御措施，AI已显著降低漏洞利用技术门槛。

目前MDASH正进行小范围私测，尚未公布商业化计划。随着AI加速漏洞挖掘，安全响应速度将成为所有企业的核心竞争力。

【声明】内容源于网络

新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

内容 16043

粉丝 0

新智元智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

总阅读197.5k

粉丝0

内容16.0k