报告大家一个好消息!
近日,国家数据局公布了全国首批数据标注优秀案例。蚂蚁数科申报的“AI数据标注平台”凭借领先的技术创新与丰富场景实践,从417个参评项目中脱颖而出,成功入选《数据标注优秀案例集》。
在大模型时代,高效低成本数据标注与优质行业数据成为释放AGI价值的关键。
蚂蚁数科AI数据标注平台,通过“垂类大模型+智能标注”融合策略,实现长思维链标注、智能质检、数据合成等功能,并重构数据生产范式,实现“质量-效率”双重突破。
该平台已应用于自动驾驶、互联网、金融、医疗健康等丰富场景。
提高大模型训练效果:针对DeepSeek等强化学习推理模型的新技术趋势,平台创新推出“思维链标注”能力,在某金融场景,平台支持的思维链数据推动大模型FinEval等常用Benchmark 提升5%~10%。
提升高质量数据规模:通过知识注入、种子数据增广、反事实推理、强化学习、人机协同,实现数据合成,有效扩大数据规模,解决垂类高质量数据短缺问题。在某金融场景,通过合成数据扩充了30%的数据交付量。
提高数据标注效率:根据不同标注任务,辅标Agent(界面内嵌AI助手)从插件市场中,灵活组装标注能力,实时推荐标注路径,自动补全标签,大大提高标注人员效率。在某石油场景,提高标注人员20%的标注效率。
未来,我们也将持续深耕数据与AI技术创新,为行业提供数据标注、加工、生成为一体的综合方案,通过高质量数据赋能大模型落地千行百业。

