-
赛题名称:AI Mathematical Olympiad - Progress Prize 3 (AIMO Progress Prize 3) -
赛题类型:大模型 -
赛题任务:用 LaTeX 格式编写的奥林匹克水平的数学问题
https://www.kaggle.com/competitions/ai-mathematical-olympiad-progress-prize-3/overview
赛题背景
AI 数学奥林匹克 (AIMO) 是一项旨在推动人工智能在数学推理领域进步的竞赛,由 $1000 万美元的基金支持。数学推理被认为是 AI 的一个关键里程碑。
-
现状挑战: 尽管闭源模型已在 2025 年的 IMO(国际数学奥林匹克)中达到金牌水平,展现了解决全球最具挑战性高中数学问题的能力,但开源模型的能力仍存在显著差距(例如,商业模型能解决 AIMO2 公共排行榜 50 题中的 50 题,而最高 Kaggle 得分仅为 34/50)。 -
本届目标 (AIMO3): 本次竞赛是第三届 AIMO 进步奖,旨在加速开源社区的进展,缩小与闭源模型的差距。
赛题任务
创建开源算法和模型,以解决用 LaTeX 格式编写的奥林匹克水平的数学问题。
-
难度: 问题难度涵盖国家奥林匹克级别到 IMO 标准(高中数学成就的顶峰)。 -
原创性: 110 道问题全部原创,确保零数据污染,并经过精心设计,要求模型进行真正的数学推理(即“AI 难题”)。 -
领域: 问题跨越代数 (Algebra)、组合学 (Combinatorics)、几何学 (Geometry) 和 **数论 (Number Theory)**。 -
答案范围: 所有问题的正确答案都是0 到 99999(含)之间的整数。任何模运算(取余)要求都会在问题描述中明确说明。
赛题数据集
好的,这是对 AI 数学奥林匹克 - 进步奖 3(AIMO Progress Prize 3)竞赛数据集的介绍。
🔢 赛题数据集概述
该竞赛的数据集由 110 道数学问题组成,风格类似于 AIME(美国数学邀请赛)和更高难度的奥林匹克竞赛(如国家奥林匹克到 IMO 级别)。所有问题均为纯文本,数学符号使用 LaTeX 格式表示。尽管有些问题可能涉及几何学,但不提供任何图表。
-
数据集划分: 110 个问题分为三个部分。
-
reference.csv: 包含 10 个参考问题。 -
test.csv: 包含 50 个占位符问题(实际运行时会被真实公共测试集问题替换)。 -
sample_submission.csv: 示例提交文件,用于展示正确的提交格式。
评分方式
提交的 Notebook 将对私有测试集运行两次,并根据两次预测结果计算惩罚性准确率 (penalized accuracy) :
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
总分为所有问题的得分之和。
关键时间轴
所有截止时间均为 UTC 时间 11:59 PM。
-
2025 年 11 月 20 日: 竞赛开始 -
2026 年 4 月 8 日: 参赛截止日期(需在此日期前接受竞赛规则) -
2026 年 4 月 8 日: 队伍合并截止日期 -
2026 年 4 月 15 日:最终提交截止日期 -
最终结果: 提交截止后,所选提交将针对私有测试集运行两次,最终结果将在短期内公布。
# 学习大模型 & 讨论Kaggle #
每天大模型、算法竞赛、干货资讯

