顾名思义,极端值明显与众不同,也叫异常值、离群值。它们要么太大,要么太小,落到正常的区间之外。如图1,该产品的需求没有季节性,也没有趋势,如果我们用平均需求加减两倍的标准差作为上下限,那么第6周的需求超出上限,就是极端值。

图1:极端值示例
极端值也可能来自输入错误,比如录入时多打个零,漏掉小数点什么的。极端值也可能是偶发需求,比如新冠刚开始时,美国人一窝蜂地囤积卷筒纸;日本排放核废水后,某国人一窝蜂地抢购食盐。极端值更可能是人为显著改变需求的结果,比如618、双十一的大促销。
有些极端值能清楚定义根源,比如灾害性天气;有些则是随机的,未知的。不管怎么样,极端值不但会显著降低预测模型的准确度,而且可能带来系统性偏差,我们不能等闲视之,下面分享三种常见的处理方式。
第一种做法是极端值的根源未知而且是一次性的,那就纠正极端值,也就是说用正常的值来取代极端值。
就拿图1中的第6周来说,假定我们不知道这需求是怎么发生的,且认定是一次性的,以后不会发生,我们可参考一系列的方法来推算其“正常值”:
• 用时间序列的平均值来替代,那就是155。
• 用一段时间,比如前后各4周的平均值来替代,那就是152。
• 取前后两个值的中间值,那就是135。
• 切去超出上下限的部分,那就是214。
相信会有人问,这么多的方法,每个的结果都不一样,究竟哪种最好?这需要具体业务环境下,由计划人员来判断。
比如由于货期快到而打折清仓,那么可以用打折开始前几期的平均值(打折结束后,大家都不买东西了,需求有可能偏低,不具代表性)。由于短缺造成恐慌,导致客户下了太多订单的处理方式类似。
但对于已知的促销,比如双十一,促销前一段时间,大家都在期待着促销,需求会偏低;促销后一段时间,大家都买到东西了,需求也会偏低。所以,这里要避开促销前后的两段谷值,用期外的正常需求来修正。
有些计划软件有识别极端值的能力,并剔除、修正极端值。风险是,这种识别完全是基于数据分析,比如把变动超过一定幅度的就当做“异常”,自动剔除或修正,可能导致得出错误的结论。要知道,有些情况是以极端值的方式出现,但并不是一次性的,不能简单地剔除或者修正,否则可能导致错误的结论。
典型的例子就是南极上空的臭氧洞。多年来,由于氯氟烃的危害,南极上空的臭氧在减少,相关数据是监测到了,结果被软件当做不可靠的异常数据给自动剔除了,并被代以看起来更靠谱的数据。更具讽刺意味的是,美国宇航局也记录下了臭氧含量的变化,却又被当成操作人员笔误,又一个“数据清洗”造成的悲剧。
我们可以用软件来帮助识别,但最好是逐个人工来评估、纠正极端值。如果工作量太大的话,不得不用软件自动纠正的话,那么我们要把自动纠正的门槛设得更高一些。门槛究竟设多高,可提取一部分数据,跟人工调整的对比,来确认自动纠正的结果差不多才行。
网上常说的数据分析,主要对象是这些年流行的“大数据”,而清洗工作也主要是通过计算机完成。比如检验数据的一致性,发现超出正常范围、逻辑上不合理或者相互矛盾的数据,供进一步核对和纠正;用样本均值、中位数或众数代替无效值和缺失值,删除特定样本,甚至删除整个变量等。
第二种做法是知道极端值的根源,用不同的模型把极端值与正常值分开预测。
比如一个电商进入线下渠道,铺货造成一次性需求,形成极端值。我们可以把线上、线下两股需求分割开来,分别预测。比如跟渠道管理人员确认后,线下渠道铺货大概是3个月的量,那么我们可以估算每个月的用量,指导后续线下渠道的预测。而线上部分呢,还是按照原来的电商业务来预测。
每年的双11、618、黑色星期五等的促销,以及固定节假日的需求,也可以单列出来,一部分按照正常模型来预测,而电商节、节假日的特殊部分可借鉴前些年的销量,或者销售的判断来预测。这意味着有两个模型,而这两个模型一般是不同的。
当然,分开预测假定我们能够清晰地识别不同需求,并在需求历史中分割开来。否则,还是按照同一个时间序列来预测为好。
第三种做法是用同一个模型,跟正常需求一道预测极端值,前提是我们能知道极端值的根源,比如极端天气、特定活动。
比如有个新零售企业,一旦天下雨,就有更多的人通过App下单,带来极端需求,造成库存短缺、运力不足。那我们在预测正常需求的模型中,可加上天气这一虚拟变量,下雨天为1,不下雨为0,然后根据天气预报来计划未来一天、两天、三天的需求,提前准备库存,筹备运力等。
到现在为止,我们介绍了三种常见的处理极端值的方法。想再次强调的是,有些极端值不是一次性的,而是反映了剧烈变动的需求,我们不能简单地忽略,或者推导一个“正常值”来替代。人天生不喜欢极端值,看到不顺眼的“枝丫”就顺手砍掉,这样让预测模型看上去很完美,却是掩耳盗铃,非常危险的。
比如说,销售在每个季末都大规模促销、压货,出现极端值,然后需求就大幅下降,我们还不能简单地清洗,削峰填谷,而要么管理需求来平滑需求,要么建立合适的模型来预测。否则,我们可能低估需求的波动性,没法满足严苛的服务水平要求。
这都要求我们贴近业务,更好地理解业务。毕竟,理解极端值的过程,也是理解需求,管理需求的过程。
----------------------
围绕我的系列畅销书,我开发了3门精品课程,已经推出500余次。2025年培训全新升级,5月份的培训在上海、深圳,正在报名中。
1. 供应链的三道防线:需求预测、库存计划、供应链执行(3天)(深圳 5月16-18日,上海 5月23-25日)
计划是供应链的引擎,需求预测是计划的龙头。需求预测怎么做,才能避免大错特错,力争精益求精,提高首发命中率?需求预测由谁做,才能更加有效地对接销售和运营,提高预测准确度?需求预测做错了,如何快速反应,尽快纠偏和补救?
从2025年开始,我们增加了需求预测应用,会介绍5种最常用,也是最重要的预测模型,来预测随机变动、趋势和季节性需求,包括模型参数的优化,准确度的统计,模型优劣的判断等。所有应用都在Excel中实现。
我们还会分享系统的库存控制,包括库存的“七分管理”和“三分技术”:其一,库存是天使也是魔鬼,究竟多少算合适?其二,库存计划是个技术活,究竟怎么做?其三,如何改变组织行为、降低不确定性、缩短周转周期来控制整体库存?
2. 采购和供应商管理:一个实践者的角度(1天)(深圳 5月14日,上海 5月21日)
产品成本的70%甚至更多来自供应商,降本增效的关键是对供应商“有选择、有管理,谁选择、谁负责”。这要求形成跨职能、跨阶层合力,有效管控“有能力,但也有脾气”的战略供应商;整合“没脾气,但也没能力”的一般供应商,以打破劣质低价、低价劣质的恶性循环。
这也要求采购成为一个战略职能,从订单操作层面的“小采购”,上升到战略寻源和供应商管理为主的“大采购”。本培训会详细探讨“大采购”的职责定位、组织建设和绩效考核,兼顾采购的集中与分散,帮助企业顺利实现采购职能的战略转型。
3. 供应链的全局观:高成本、高库存、重资产的解决方案(深圳5月15日,上海 5月22日)
随着经济增速的放缓,成本压力大、库存水平高、投资回报低的问题就更加严峻。
从供应链的全局观角度,本培训提出系统的解决方案:(1)控制产品复杂度,提高规模效益来降低产品成本;(2)改善计划,有效地匹配需求和供应来降低库存和运营成本;(3)管好专业供应商,外包非核心业务,走轻资产之路来降低固定成本。
我们还会详细探讨供应链在集成产品开发(IPD)和集成供应链(ISC)中的角色,以优化产品设计与选型、协同销售与运营,以及避免“牛鞭效应”和多重需求预测带来的库存积压、产能利用问题。
培训详情及企业团体优惠,请垂询助手 党琪:182 1756 2014(微信同)。

