
面对大数据多样性(Variety)挑战所包含的数据种类多问题,一般有专用或通用两种模式。专用模式为每种数据类型量身定做专门的处理系统,因此需要为多个数据类型开发多个处理系统,性能较好但是开发维护的成本高,适用范围窄。而通用模式开发一个统一的系统来处理多种类型的数据,性能较差,但是具有较低的开发维护成本和较宽广的适用范围。商业软件为了追求最大的利润,一般都是采用通用模式的方法,通过高性价比来吸引用户。
实现通用模式的基本途径是首先把多种数据按照其共性抽象到统一数据类型和统一的匹配衡量方法,然后针对统一的数据类型和匹配衡量方法进行数据处理。
因赛题原理部分涉及专业数学符号,为避免产生歧义影响各队伍优化作业,具体内容还请各队下载赛题文档查看(https://pan.baidu.com/s/1Ct-SOtspSPOiQhEYdK2HRA 提取码:IPCC)。该内容已于官网(http://www.paraedu.org.cn/resource/index)及QQ群(1046805935)文件中同步。
1. 源码包包括以下文件:
a) pivot.c 源代码文件
b) uniformvector-2dim-5h.txt 输入数据文件
c) refer-2dim-5h.txt基准输出文件
2. 程序使用方法:
a) 源码包位置 /public1/soft/IPCC/2022/first/pivot.tar
b) 参考编译命令 gcc pivot.c -lm -o pivot
c) 集群参考运行命令 srun -p IPCC -N 1 ./pivot
3. 比赛考核程序求出目标函数值最大和最小的各1000个支撑点组合所用总时间,以程序输出“Using time”时间为准,不包括读写文件的时间,不得修改计时函数的位置。
4. 输入数据文件uniformvector-2dim-5h.txt不可修改。
5. 可以改变源代码的数据结构和数据类型,优化方法需要对满足三角不等式的距离函数适用。
6. 以result.txt结果文件作为评判标准,所选出的目标函数值最大和最小的各1000个支撑点集合及其顺序须与refer基准文件完全相同。即先按目标函数值降序排序,输出目标函数值前1000大的点集;再按目标函数值升序排序,输出目标函数值前1000小的点集。
7. 参赛队员可自行更改编译方式,但需要留存脚本文件或Makefile文件。
8. 后续将发布多组参数和数据用于结果验证,各组数据对最终成绩权重占比相同。
1. 优化版源代码
1) 包含编译、运行方式。可进行重新编译,并且能够正确生成可执行文件。
2) 不涉及版权问题,大赛组不负责保障源代码安全。
2. 性能优化过程记录表
3. 技术报告PPT(含讲解录音)
1) 应用程序运行的硬件环境和软件环境,其中软件环境至少包括操作系统、并行环境、相关依赖软件、所运行的应用负载等。
2) 提供参赛应用程序的代码结构,从设计思路到主要流程设计及主要功能模块。
3) 详细介绍参赛应用程序中采用的优化方法,基于优化方法达到的优化结果和性能指标。
4) 详细描述程序运行结果。
5) 参赛作品讲解录音(不多于5分钟),注意录音环境安静,确保作品质量。
4. 请于2022年8月15日23:59前压缩以上文件上传至百度云盘(注意文件分享选择“永久有效”),登录官网个人主页,在“我的队伍”界面选择对应赛事队伍后提交。
1. 所有赛区初赛组织专家评审会,针对所有参赛方案进行评分,参赛队无需出席。
2.参赛队需在作品提交截止前于组委会指定平台(https://cloud.blsc.cn/)运行初赛程序。(注意:请提前注册平台账号并申请试算核时)
3. 提交方式:上传百度网盘,登录官网个人主页,在“我的队伍”界面提交链接及提取码。
4. 组委会收到参赛队程序后,将以程序运行5次时间的均值作为上机成绩最终评分依据。
5. 初赛成绩中,上机成绩占比80%,技术报告PPT讲解成绩占比20%。
6. 如参赛队发生任何学术不端、违反组委会规定的行为,组委会有权取消其参赛资格,并视情况向所在单位通报。
1. 官网:www.paraedu.org.cn
2. 微信:北京超级云计算中心(ID:BJBLSC)
3. 组委会:18310726311
4. IPCC-QQ群:1046805935(学生/参赛选手);1095416620(指导老师)
5. 邮箱:ACM_IPCC@163.com
责任编辑:刘芳
审核:贺志强
第三届ACM中国-国际并行计算挑战赛
--报名时间延长至 7月25日--

