大数跨境
分享
豆包大模型团队发布开源基准测试集SuperGPQA
2025-03-04 11:54 星期二
3月4日,豆包大模型团队开源了SuperGPQA,这是一个全面覆盖多领域并具有高度区分度的知识推理基准测试数据集。该数据集包含了285个研究生级别的学科和26529个专业问题,涵盖了主流学科以及轻工业、农业、服务科学等长尾学科,填补了长尾知识评估领域的空白。
新闻推荐 查看更多
大数新闻社群
7x24h跨境新闻推送
加入卖家交流群