大数跨境
0
0

回顾外滩丨ATEC“数星”计划发布,开源亿级工业数据集

回顾外滩丨ATEC“数星”计划发布,开源亿级工业数据集 蚂蚁技术AntTech
2023-09-18
0
导读:填补了行业内多场景多模态点击率预估问题的数据集空白。


9月8日上午,在上海举行的2023 inclusion·外滩大会《从机器智能到人机智能论坛上,ATEC前沿科技探索社区宣布启动ATEC“数星”计划。


这是业内首个基于真实工业场景的大规模研究性数据集开放计划,首批将公开两个脱敏的、超大规模的工业数据集——ATEC2022赛事数据集“农村金融风险预测”和蚂蚁集团多场景多模态点击率预估数据集(AntM2C)。



“农村金融风险预测”中包含了涉农经营者的信贷风险信息及用户的历史多源交互数据。如何利用数字化技术识别农村经营者的经营状况和经营风险,是帮助农村经营者进行融资的基础能力之一。该数据集在遵循国家法律法规及个人隐私保护的前提下,为金融科技领域、特别是农村金融科技领域的行业研究和发展提供了重要的数据支持。


AntM2C覆盖支付宝内多个业务场景,包含广告、营销、搜索和推荐真实场景中不同类型商品的CTR数据,整体数据规模达到10亿(第一阶段发布1700万规模的数据)。该数据集的发布填补了行业内,多场景多模态点击率预估问题的数据集空白。


清华大学计算机系副系主任、ATEC前沿科技探索社区发起人徐恪教授指出,“数星”计划是ATEC社区在科技赛事、高校实训之后的又一项重要举措。数字技术的研究和发展离不开真实应用的数据土壤,亿级规模工业数据集,将成为人机智能等创新技术的关键燃料,推动机器智能等新一代数字技术的新范式发展。


目前,“数星”计划的数据集可在ATEC官方平台下载。


ATEC 是信息领域前沿技术实践发展社区,致力于搭建面向新一代互联网相关技术的产学研合作平台,推动创新技术的产业应用研究,支持实践型技术人才培养,传播积极奋进的工程师文化。社区的发起单位包括清华大学、上海交通大学、浙江大学、西安交通大学和蚂蚁集团等。


人机混合智能是人工智能发展的必经之路,本次论坛围绕以人为本的人机增强Al技术的关键技术发展和价值,以及产业应用和实践等进行了探讨。同济大学校长郑庆华,清华大学计算机系教授、信息科学与技术国家研究中心副主任朱文武,浙江大学教授吴飞,蚂蚁集团资深算法专家顾进杰等做主题演讲。



想了解更多2023 INCLUSION·外滩大会一手资讯

记得持续关注“Inclusion外滩大会”官方微信账号哦~

最新内容持续更新中!

点击“阅读原文”,获取更多大会信息!

↓↓↓

【声明】内容源于网络
0
0
蚂蚁技术AntTech
科技是蚂蚁创造未来的核心动力
内容 1081
粉丝 0
蚂蚁技术AntTech 科技是蚂蚁创造未来的核心动力
总阅读50
粉丝0
内容1.1k