>

模速空间模型评测服务平台正式上线，从不同维度对大模型进行精准评估

>

0

0



模速空间模型评测服务平台正式上线，从不同维度对大模型进行精准评估

模速空间模型评测服务平台正式上线，从不同维度对大模型进行精准评估

上海模速空间大模型创新生态社区

2025-06-09

0

在人工智能蓬勃发展的今天，大模型的应用和优化成为了行业关注的焦点。为了推动这一领域的进步，打造一个公开、公正的大模型评测环境，模速空间模型评测服务平台（http://mcbench.opensmc.com）正式上线，为大模型的评测与发展注入了新的动力。

模速空间模型评测服务平台共包含八大功能：

评测任务管理：

认证用户可自行选择待评测模型，创建评测任务、查看评测任务进度及结果

评测环境及工具：

用户可选择不同的评测工具执行评测任务

测试数据集：

提供多维度的测试集，包含推理、知识、代码、理解、数学、语言、安全、合规等不同类别

自动化评测：

支持定时定期的自动化评测并自动化生成评测结果

评测报告：

对完成评测的评测任务会自动生成包含评分的模型评测报告

模型比武：

用户可自选或匿名方式选择不同的大模型，并根据与大模型的真实对话体验进行投票

评测榜单：

支持不同模型的多维度评测榜单展示，包括不同维度测试集的模型榜单展示，比武结果榜单展示等

用户认证管理：

面向所有用户开放模型比武场体验，模速空间企业认证用户可直接登录评测服务平台

目前，模速空间模型评测服务平台已经支持数十个国内外主流大模型，配备了多个专业的评测工具，囊括了多个权威的评测数据集，能够从不同维度对大模型进行精准评估，不仅为大模型提供了一个评测的舞台，更为整个人工智能行业搭建了一个交流和进步的桥梁。

【声明】内容源于网络

0

0

上海模速空间大模型创新生态社区

“模速空间”是全国首个大模型专业孵化和加速载体，立足徐汇滨江，基于“十百千万”目标，打造数据、算力、评测、金融、综合等功能平台，赋能各通用大模型、垂类大模型、大模型应用创新初创企业汇聚上海、引领全国、扬帆世界。

内容 597

粉丝 0

上海模速空间大模型创新生态社区 “模速空间”是全国首个大模型专业孵化和加速载体，立足徐汇滨江，基于“十百千万”目标，打造数据、算力、评测、金融、综合等功能平台，赋能各通用大模型、垂类大模型、大模型应用创新初创企业汇聚上海、引领全国、扬帆世界。

总阅读14

粉丝0

内容597