数据去重就是一个比较简单的数据处理工作。此外,也经常需要将几个表格进行合并然后去重,保留唯一数据。
数据去重可以使用UNIQUE函数,如果再联合使用其他函数,就可以实现更加灵活的数据处理和分析。
UNIQUE函数用于从单元格区域或数组中提取唯一值,也就是自动去除重复项,返回一个仅包含唯一值的列表,其语法如下:
= UNIQUE(单元格区域或数组,按列还是按行比较,返回所有唯一值还是仅出现一次的值)
UNIQUE函数有三个参数,第1个参数是必需的,其他2个参数是可选的,说明如下。
如果一个表格存在重复数据,势必会影响数据分析结果,因此必须对数据进行去重处理。
数据去重最简单的方法是利用Excel的内置工具“删除重复值”,这个工具会将数据区域内的重复数据删除,保留唯一值。
如果想要保留原始数据区域,而将去重后的数据唯一值保存到新位置,则可以使用UNIQUE函数来实现了,公式也很简单,根据需要合理设置UNIQUE函数的参数即可。
例如,下图左侧的原始数据中,有几行数据是重复的,现在想保留原始数据,而将驱虫后的数据保存在新位置,结果如图右侧的表格,单元格H3的公式如下:
在实际工作中,一个表单可能是几个人分别完成的,每个人的数据保存为一张表单,可能会出现重复录入数据的问题,也就是就说,某些数据可能重复出现在某几个表单中,此时,我们需要将这些表单合并起来(VSTACK函数),并进行去重处理(UNIQUE函数)。
下图是三个工作表数据,有些数据在三个工作表或者某两个工作表都存在,现在的任务是将这三个工作表的不重复数据合并为一个新表。
插入一个新工作表,重命名为“合并表”,现在第一行输入标题,然后在A2单元格输入下面的公式,就得到不重复数据的合并表:
= UNIQUE(VSTACK(张三!A2:D9,李四!A2:D11,王五!A2:D7))
下图的左侧A列至C列是从系统导出的数据,现在要设计一个通用公式,计算每个部门的合计金额,如F列至G列所示。
部门名称, UNIQUE(MID(FILTER(科目名称, LEFT(科目名称,1)="["), 5, 100)),
金额合计, SUMIF(科目名称, "*" & 部门名称, 发生额),
------------------------------