各位可能都遇到过这种场景,月报表出来之后发现销售额异常,然后领导@你,要求你快速给出数据异常的解释。
这个时候我们就要进行数据异常排查,看看这个异常到底是真实业务场景传导出的信息,需要领导层根据数据做出决策。还是由于某些技术原因导致的假异常,需要技术进行快速修正。
异常值判断方法1
维度定位法
根据业务场景的操作步骤进行数据指标分解,逐层找出数据异常的业务节点,从而快速上报进行敏捷型干预。
举例:零售场景中将销售额指标进行拆解,得到三个二级指标:客群流量/客群转化率/客均单价。这三个二级指标的乘积就是销售额,现在销售额较上个季度明显下降,那么我们需要在二级指标中发现到底那个指标明显发生变化,比如发现客群流量大幅减少,那么我们就可以更近一步拆分客群流量这个二级指标继续下钻,从而最终定位到具体哪一个渠道的流量大幅度变化从而影响了整体的销售额。这也就是所谓的归因分析。
优势:速度快,结论准
劣势:需要对数据指标的逻辑关系以及其业务节点相对熟悉。
异常值判断方法2
逻辑差异法
这种方法是根据一些互斥指标的变化发现其异常值是否为正常变化的情况,常用与异常值的定性判断。
举例:还是以刚刚的零售场景为例,销售额异常波动,但是检查其他互斥指标发现入口流量/客均单价/客户转化率较上个季度都有所增长,所以按照入口流量❌客户转化率❌客均单价=销售额,明显可得到在三个子指标都增长的情况下不可能出现销售额下降的数据展现,所以可以从逻辑上判断该异常为一个假异常,需要技术部门尽快修复异常值。
优势:快速判断数据异常是否是真异常
劣势:用于定性判断,但是多因子上下波动时无法使用
总结,当我们在工作过程中需要对数据波动的异常进行研判时我们一般可以遵循如下的方法:
✅先定真伪:定性判断数据是否真异常
✅粗筛定位:异常确认后,先定异常大致位置:业务OR技术
✅分解确因:通过逐层对关联指标进行验证最终确认引起波动的子指标,结合业务进行及时干预
更多关于MCI的信息请访问:www.wearemci.com

