雅意大模型新基座YAYI-Ultra上榜权威评测前十- 大数跨境

新鼎资本

2025-02-15

近日,权威大模型评测平台OpenCompass更新大语言模型公开学术榜单，雅意大模型YAYI-Ultra排名第十，综合得分64.5。同期，在C-Eval中文大模型评测公开访问榜中，YAYI-Ultra排名第二，综合得分87.7分。

OpenCompass大语言模型公开学术榜 Top10

OpenCompass大语言模型公开学术榜分项排名：

YAYI-Ultra代码评测集LiveCodeBench排名第五

表现优于GPT-4o-20241120

C-Eval中文大模型评测（公开访问榜）

YAYI-Ultra 是以多领域能力为特色的混合专家模型，为了提升在不同领域专业任务上的表现，采用灵活的专家配置模式，支持数学、代码、金融、舆情、中医、安全等多种领域专家组合，能显著缓解稠密模型在垂直领域迁移过程中普遍存在的“跷跷板”现象，可针对不同领域的客户需求，快速提供兼顾领域特色能力与低资源消耗的大模型解决方案。

YAYI-Ultra具备多模态图表深度理解、复杂图像理解、复杂任务智能规划（Function Call）、数据统计分析、超长文本理解与生成六大特色能力，目前已在雅意官网开放功能体验。

欢迎访问雅意官网yayi.wenge.com

或点击阅读原文体验

司南OpenCompass

OpenCompass是由上海人工智能实验室推出的开源大模型评测平台，对已正式发布且可公开访问的API模型进行评测，旨在为行业提供全面、客观、中立的评测参考。其中，大语言模型榜单分为官方自建月度榜单和公开学术榜单。

公开学术榜单基于国内外具有广泛影响力的开源学术评测集进行评测，涵盖Claude 3.5 Sonnet、Qwen2.5 系列、Doubao-pro、Llama3 系列、GPT-4o、GLM-4、Step-2、Yi、Moonshot-v1 等国内外主流大模型，所有模型均遵循0-shot（零样本）方式进行评估。

C-Eval

C-Eval是由上海交通大学、清华大学和爱丁堡大学联合推出的全面的中文基础模型评估套件。它包含了13948个多项选择题，涵盖了52个不同的学科和四个难度级别，C-Eval榜单分为公开访问榜和受限访问榜，公开访问榜允许用户自行验证各模型的效果，更具参考价值。

更多内容

【声明】内容源于网络

新鼎资本

北京新鼎荣盛资本管理有限公司，专注于优质项目私募股权投资。尤其新能源汽车、芯片半导体、人工智能、商业航天以及生物医药等领域。只为优质项目！

内容 5350

粉丝 0

新鼎资本北京新鼎荣盛资本管理有限公司，专注于优质项目私募股权投资。尤其新能源汽车、芯片半导体、人工智能、商业航天以及生物医药等领域。只为优质项目！

总阅读2.8k

粉丝0

内容5.3k