

93.04分！安天澜砥大模型再次登顶CyberSec-Eval评测TOP1

安天集团

2025-10-22

导读：综合排名第一，四个单项第一，一项持平。

点击上方"蓝字"

关注我们吧！

10月22日，安天澜砥威胁检测分析垂直大模型（N2-1021版本）以93.04分再次登顶CyberSec-Eval动态评测榜，并在加密技术与密钥管理、AI与网络安全、漏洞管理与渗透测试、供应链安全、安全架构设计评测中取得五个单项第一名或与单项第一持平成绩。

澜砥大模型是安天研发的模型族，主干模型VILLM （Virus Inspection Large Language Model）由安天全面自研，可处理二进制字节数据、进行威胁检测分析，支持最长336M的超长上下文分析；另外两个分支模型SecOpsGPT（大安）侧重自然语言处理与多模态数据理解、SecDevGPT（小元）侧重程序代码补全，分支模型基于开源模型改造并使用社区权重进行迁移学习训练，分别用于安全运营辅助和安全开发辅助。

▲ CyberSec-Eval综合排名TOP10

▲ 安天澜砥威胁检测垂直模型各分项得分情况

细分领域

单项最高分

安天澜砥单项得分

单项排名

系统安全及软件安全基础

96.67

94.67

3

访问控制与身份管理

95.02

93.1

2

加密技术与密钥管理

97.08

97.08

1

基础设施安全

93.51

93.01

2

AI与网络安全

95.05

95.05

1

漏洞管理与渗透测试

92.72

92.72

1

威胁检测与预防

93.36

92.8

4

数据安全和隐私保护

92.26

89.88

4

供应链安全

95.68

95.68

1

安全架构设计

92.68

92.68

2
与第一同分

业务连续性与应急响应恢复

93.33

90.33

3

中文任务

93.11

93.11

1

英文任务

92.12

92.12

1

▲ 安天澜砥单项分数、排名和与最高分对比表（单项排名第一或持平的为红色）

附：安天澜砥大模型参测CyberSec-Eval轨迹

9月9日，安天团队澜砥大模型-SecOpsGPT子模型首次提交测试并于次日公开，平均分综合成绩88.3分，排名第三，并取得3个单项的第一名或与第一名同分。

10月8日，基于VILLM+SecOpsGPT整合为澜砥大模型N2，提交N2-1008版本测试以91.51的平均分综合成绩排名第一登顶，并取得四个单项的第一名或与第一名同分。

10月13日，其他参测方新提交取得92.52分，排名降为第二。团队持续训练模型、调整优化提示词。

10月15日，提交N2-1015版本，以92.54分重回榜单第一名，成绩保持到10月20日。

10月21日，伴随其他参测方新的提交，排名降至第二。团队持续训练模型、调整优化提示词，提交N2-1021版本。

10月22日，澜砥N2-1021提交通过审核，以93.04分再回榜首，并取得五个单项的第一名或与第一名同分。

往期推荐:

安天澜砥大模型登顶CyberSec-Eval评测榜

安天澜砥威胁检测分析垂直大模型入选“年度大模型创新技术”

澜砥大模型辅助样本分析，首批邀请百人

澜砥大模型助力文件检测分析，有效提升应急处置效率(上）

澜砥大模型助力文件检测分析，有效提升应急处置效率(下）

【声明】内容源于网络

安天集团

1234

内容 1430

粉丝 0

安天集团 1234

总阅读5.5k

粉丝0

内容1.4k

细分领域	单项最高分	安天澜砥单项得分	单项排名
系统安全及软件安全基础	96.67	94.67	3
访问控制与身份管理	95.02	93.1	2
加密技术与密钥管理	97.08	97.08	1
基础设施安全	93.51	93.01	2
AI与网络安全	95.05	95.05	1
漏洞管理与渗透测试	92.72	92.72	1
威胁检测与预防	93.36	92.8	4
数据安全和隐私保护	92.26	89.88	4
供应链安全	95.68	95.68	1
安全架构设计	92.68	92.68	2 与第一同分
业务连续性与应急响应恢复	93.33	90.33	3
中文任务	93.11	93.11	1
英文任务	92.12	92.12	1