一 提供一组数据,要求做数据清洗

-
完整性:数据必须完整,不能包含空值。 -
全面性:对于某一个字段,需要检查所有的数值,确保该字段的所有值都被收集完整。 -
唯一性:数据必须是唯一的,不能重复。 -
一致性:如果数据来自不同的渠道,其格式、单位等应该一致、数据在不同处理方法之间的数值应该一致。 数据格式:数据应该按照数据挖掘和分析的要求进行格式化。例如,数据应该按照时间序列或矩阵的格式进行存储。
二 数据集关联规则挖掘
三 数据集特征生成
大数据分析与应用
数据格式:数据应该按照数据挖掘和分析的要求进行格式化。例如,数据应该按照时间序列或矩阵的格式进行存储。