大数跨境
0
0

模速空间模型评测服务平台正式上线,从不同维度对大模型进行精准评估

模速空间模型评测服务平台正式上线,从不同维度对大模型进行精准评估 上海模速空间大模型创新生态社区
2025-06-09
0

在人工智能蓬勃发展的今天,大模型的应用和优化成为了行业关注的焦点。为了推动这一领域的进步,打造一个公开、公正的大模型评测环境,模速空间模型评测服务平台(http://mcbench.opensmc.com)正式上线,为大模型的评测与发展注入了新的动力。

模速空间模型评测服务平台共包含八大功能:


评测任务管理:

认证用户可自行选择待评测模型,创建评测任务、查看评测任务进度及结果

评测环境及工具

用户可选择不同的评测工具执行评测任务

测试数据集:

提供多维度的测试集,包含推理、知识、代码、理解、数学、语言、安全、合规等不同类别

自动化评测:

支持定时定期的自动化评测并自动化生成评测结果

评测报告:

对完成评测的评测任务会自动生成包含评分的模型评测报告

模型比武:

用户可自选或匿名方式选择不同的大模型,并根据与大模型的真实对话体验进行投票

评测榜单:

支持不同模型的多维度评测榜单展示,包括不同维度测试集的模型榜单展示,比武结果榜单展示等

用户认证管理:

面向所有用户开放模型比武场体验,模速空间企业认证用户可直接登录评测服务平台


目前,模速空间模型评测服务平台已经支持数十个国内外主流大模型,配备了多个专业的评测工具,囊括了多个权威的评测数据集,能够从不同维度对大模型进行精准评估,不仅为大模型提供了一个评测的舞台,更为整个人工智能行业搭建了一个交流和进步的桥梁。


【声明】内容源于网络
0
0
上海模速空间大模型创新生态社区
“模速空间”是全国首个大模型专业孵化和加速载体,立足徐汇滨江,基于“十百千万”目标,打造数据、算力、评测、金融、综合等功能平台,赋能各通用大模型、垂类大模型、大模型应用创新初创企业汇聚上海、引领全国、扬帆世界。
内容 597
粉丝 0
上海模速空间大模型创新生态社区 “模速空间”是全国首个大模型专业孵化和加速载体,立足徐汇滨江,基于“十百千万”目标,打造数据、算力、评测、金融、综合等功能平台,赋能各通用大模型、垂类大模型、大模型应用创新初创企业汇聚上海、引领全国、扬帆世界。
总阅读14
粉丝0
内容597