大数跨境
0
0

Kaggle赛题解析:第三届 AI数学奥赛挑战赛

Kaggle赛题解析:第三届 AI数学奥赛挑战赛 Coggle数据科学
2025-11-25
55
  • 赛题名称:AI Mathematical Olympiad - Progress Prize 3 (AIMO Progress Prize 3)
  • 赛题类型:大模型
  • 赛题任务:用 LaTeX 格式编写的奥林匹克水平的数学问题

https://www.kaggle.com/competitions/ai-mathematical-olympiad-progress-prize-3/overview

unsetunset赛题背景unsetunset

AI 数学奥林匹克 (AIMO) 是一项旨在推动人工智能在数学推理领域进步的竞赛,由 $1000 万美元的基金支持。数学推理被认为是 AI 的一个关键里程碑。

  • 现状挑战: 尽管闭源模型已在 2025 年的 IMO(国际数学奥林匹克)中达到金牌水平,展现了解决全球最具挑战性高中数学问题的能力,但开源模型的能力仍存在显著差距(例如,商业模型能解决 AIMO2 公共排行榜 50 题中的 50 题,而最高 Kaggle 得分仅为 34/50)。
  • 本届目标 (AIMO3): 本次竞赛是第三届 AIMO 进步奖,旨在加速开源社区的进展,缩小与闭源模型的差距。

unsetunset赛题任务unsetunset

创建开源算法和模型,以解决用 LaTeX 格式编写的奥林匹克水平的数学问题。

  • 难度: 问题难度涵盖国家奥林匹克级别到 IMO 标准(高中数学成就的顶峰)。
  • 原创性: 110 道问题全部原创,确保零数据污染,并经过精心设计,要求模型进行真正的数学推理(即“AI 难题”)。
  • 领域: 问题跨越代数 (Algebra)组合学 (Combinatorics)几何学 (Geometry) 和 **数论 (Number Theory)**。
  • 答案范围: 所有问题的正确答案都是0 到 99999(含)之间的整数。任何模运算(取余)要求都会在问题描述中明确说明

unsetunset赛题数据集unsetunset

好的,这是对 AI 数学奥林匹克 - 进步奖 3(AIMO Progress Prize 3)竞赛数据集的介绍。


unsetunset🔢 赛题数据集概述unsetunset

该竞赛的数据集由 110 道数学问题组成,风格类似于 AIME(美国数学邀请赛)和更高难度的奥林匹克竞赛(如国家奥林匹克到 IMO 级别)。所有问题均为纯文本,数学符号使用 LaTeX 格式表示。尽管有些问题可能涉及几何学,但不提供任何图表

  • 数据集划分: 110 个问题分为三个部分。
  • reference.csv 包含 10 个参考问题。
  • test.csv 包含 50 个占位符问题(实际运行时会被真实公共测试集问题替换)。
  • sample_submission.csv 示例提交文件,用于展示正确的提交格式。

unsetunset评分方式unsetunset

提交的 Notebook 将对私有测试集运行两次,并根据两次预测结果计算惩罚性准确率 (penalized accuracy) :

两次预测结果
问题得分
两次都正确
1
一次正确,一次错误
0.5
两次都错误
0

总分为所有问题的得分之和。

unsetunset关键时间轴unsetunset

所有截止时间均为 UTC 时间 11:59 PM

  • 2025 年 11 月 20 日: 竞赛开始
  • 2026 年 4 月 8 日: 参赛截止日期(需在此日期前接受竞赛规则)
  • 2026 年 4 月 8 日: 队伍合并截止日期
  • 2026 年 4 月 15 日:最终提交截止日期
  • 最终结果: 提交截止后,所选提交将针对私有测试集运行两次,最终结果将在短期内公布。

 学习大模型 & 讨论Kaggle  #




△长按添加竞赛小助手

每天大模型、算法竞赛、干货资讯

与 36000+来自竞赛爱好者一起交流~

【声明】内容源于网络
0
0
Coggle数据科学
一个关注数据竞赛、机器学习和大模型的学习组织,每天分享最新的比赛和技术干货,与学习者一起成长。
内容 1253
粉丝 0
Coggle数据科学 一个关注数据竞赛、机器学习和大模型的学习组织,每天分享最新的比赛和技术干货,与学习者一起成长。
总阅读387
粉丝0
内容1.3k