大数跨境
0
0

理解六西格玛很难,但读完这篇六西格玛A阶段解释,你已经超越90%人!

理解六西格玛很难,但读完这篇六西格玛A阶段解释,你已经超越90%人! SQE供应商质量
2024-06-06
0
导读:在分析阶段,主在识别问题的原因,有时,原因是显而易见的,有时,影响问题的原因很多,而且非常复杂,团队

     在分析阶段,主在识别问题的原因,有时,原因是显而易见的,有时,影响问题的原因很多,而且非常复杂,团队可能要花几周或更长的时间,使用各种工具和试用各种不同的观点去分析,才能得出正确的结果。
     其中最大的挑战是正确地使用工具,能用简单工具找到根本原因,就不使用复杂工具。运用统计工具,也是六西格玛区别于其他方法的特点之一。
      本章主要解释:估计与检验、样本量的计算与检出力、相关性与回归分析,此三部分也是A阶段的主要统计工具。

一、统计推断分为两大类:估计与检验

      参数估计是以“数”为其输出结果,假设检验 以 “判断”为其输出结果。
1、点估计&区间估计:
      在正态分布中,均值、方差、标准差等,都称为总体的参数(parameter)。在实际问题中,这些参数都是未知的,常常需要选用适当的统计量作为未知参数的估计。用于估计未知参数的统计量称为点估计量,简称点估计或区间估计。
     例1:如用样本均值或中值(n<10,现实中为了简单快捷)或中位数(一些样本观测值受较大特色影响,中位数具有更加稳健的特性)代替总体均值μ。
      例2:正态方差的无偏估计,常用样本方差.
      例3:正态分布标准差的无偏估计。人们普遍认为 样本标准s就应该是正态分布标准差^最好的的无偏估计。但用s 来估计,则通常会偏小,必须对它稍加修偏才行,C4是与样本本身无关而仅与样本容量n 有关的常数,可以通过查表得到并通过下式获得修正值。
2、 假设检验
     六西格玛团队项目中应用最多的统计工具,用于判断下列结论是否正确。
     例如:判定“新员工比老员工得到更多的投诉”,“改进工作后平均产量有所提髙”,“加工温度为18〇°C 时比 160°C时垫 断裂强度要高”等。
假设检验的步骤:如下为手动计算的步骤,这里放出来,便于理解计算逻辑,它需要查表和计算。实际工作中用minitab可以轻松使用假设检验。
    1 )建立假设。假设检验的第一步便是建立假设,通常需要建立两个假设:原假设 H0和备择假设H1。
    2) 选择检验统计量,确定拒绝域的形式。
    3 ) 给出检验中的显著性水
          由于样本的随机性,判断可能产生两类错误。第一类错误 当原假设为真时,由于样本的随机性,使样本观测值落在拒绝 W 中,从而做出拒绝原假设的决定,这类错误称为第一类错误,其概率为a, 第二类错误 当原假设为 时,由于样本的随机性,使样本观测值落在非拒绝域中,从而做出无法拒绝原假设的决定,错误称为第二类错误,其概率为β,通常取β=0.10,a= 0.05(应用Minitab需要填写相应数值a、β值,用以设定该假设检验的可靠性在多少.)
    4 )给出临界值,确定拒绝域。查表得到临界值,确定具体的拒绝域。(Minitab 由于内置程式,不需要这一步)
     5 ) 根据样本观测值,计算检验统计量的值。(Minitab 由于内置程式,直接得出结果,不需要这一步)
     6 ) 根据检验统计量的值是否落在拒绝域中做出判断。
     检验统计量的值落在拒绝域中拒绝原假设,否则不能拒绝原假设。(根据Minitab 结果一般用P值是否小于0.05 判定假设检验结果)
    后面的文章,就不把统计推断工具的计算逻辑加入了,如有希望了解计算逻辑的可以参看红宝书详细介绍,我这里就直接按minitabl的介绍。
(基本概念介绍-因子和水平,便于大家统一语言和理解因,因子对指标有影响的因素称为因子。常用大写字母A ,B ,C,D 等表示。例:影响零件的加工精度,因子为加工人员A,车床 B。水平在试验中因子所处的状态称为因子的水平,用因子的字母加下标来表示,譬如因子A 的水平用A1,A2,… 表示 ,人员A1,人员A2 等,因子B的不同水平为车床B1,车床B2。等。如果一个试验中所考察的因子只有一个,那么这是单因子试验问题,举例子:只考虑人员对零件加工精度的影响。
3、单因子问题:
             总体和样本都符合正态分布的情况下,均值、方差和比率的假设检验
    (1)均值的假设检验(例:其他条件不变,某人员对零件的加工精度值与均值比较)
      ①考虑一个总体均值μ的检验:
    情况1:当总体标准差δ已知时,关于正态均值μ的假设检验
    利用Minitab 就很方便,展示如下,提供的标准差δ,要比较的均值μ,设置好置信水平,一般为95%,也就是α=0.05,即可


点击确认即可得出检验结果P值判断,并与0.05自行比较,得出判断结论。
    情况2:当标准差δ未知时,可以用的估计s 代替,大样本(n>30)时用服从正态分布的Z做统计量,当n<30时,用服从从t(n-1)分布的t做统计量,Minitab同样有t分布的函数的均值工具,这里就不做介绍了。
     ② 考虑比较两个总体均值μ的检验(比如两种注塑温度下,产品尺寸是否相等或者比较大小):
     a.当已知时 ,可 以 采 用 检 验 统 计 量Z,服从正态分布
     b.当未知时 ,δ1=δ2,采用检验统计量t,服从t分布
      例:给出两分布的数据,且标准差相等,即可计算出t分布,均值是否相等

     ③比较多个总体均值μ的检验---方差分析(应用最多,比如几个不同注塑温度下,产品尺寸是否相等,来判断温度是否是影响显著的因素)
其条件为:
      a. 在水平Ai下,如 ,是来自态分布,的一个样本,其中各个就是要比较的对象。
      b.在不同水平下的方差相等,即
要诸试验在相同条件下进,方差相等一般可以满足。
      c.各数据相互独立,这通常只要把试验次序随机化即可得到满足。
在上述三项假定下,诸总体均值是否相等的问题归结为一个假设检验问题,
其原假设与备择假设分别为:
检验这一X寸假设的统计方法便是方差分析(ANOVA)。
      由于方差分析应用较为广泛,用以判定某影响因子是否显著,这里做Minitab 操作演示。只要你判定实际问题可以抽象为方差分析的条件,选择置信水平95%,点击确认即可直接得到结果和判断是否显著的P值,P<0.05即为因子显著,比如人或者设备为影响加工精度的显著影响因子,可以做相应的优化改善
     如果在一个试验中所要考察的影响指标的因子有两个,那就是两因子试验的问题,数据分析可以采用两因子方差分析,会涉及到交互作用的概念:亦可应用minitab,篇幅有限,这里不做过多介绍。如果在一个试验中所要考察的影响指标的因子更多,那么试验往往要事先进行设计,以便用尽可能少的试验去获得数据,再对数据进行分析。
    (2)方差  的检验,可以采用检验统计量(比如在某条件下,根据样本判断总体产品尺寸标准差,是否大于小于等于某值)
     关于两个正态总体方差的检验,可以采用检验统计量F(由两种条件下的样本方差,得出两种条件下总体的方差比较)。
  可按表6-5和6-6查找对应检验统计量,判断Minitab中用哪种检验模型。

     以上各种分析方法,除其使用条件除了要求各数据间相互独立,一定还要求为正态分布。如果原始数据非正态,则Z,t,F 检验就都不能使用了。
     (3)比率P的假设检验(例如:判定某批样品抽检合格率虽然大于允许值,但是统计学角度,真的合格吗?)
    样本和总体需符合二项分布条件:
    a.试验次数固定为n,即重复进行n 次随机试验。譬如,连续拋掷一枚质地均匀的
硬币n 次,检查n 件产品的质量,对一个目标连续射击n 次等。
    b. n 次试验间相互独立,即一次试验的结果不能对其他各次试验的结果产生影响。
    c.每次试验仅有两种可能的结果:成功与失败,好与坏等。
    d. 每次试验中成功的概率均为p,失败的概率均为1 -p 。
    ①单个比率P检验。设样本X1。。。Xn 来自二点分布总体X,X-b(1,p)
在小样本场合只能使用精确的二项分布计算(计算机软件一般都可以给出结果);在大样本场合可以用近似的Z 检验。有了Minitab就不用考虑大小样本场合,只要给出样本数和假设比率。
     ②两个比率的检验。(例如:通过比较2个相同样本抽检不良率,比较抽检手法是否是影响抽检良率不同的因素)
     设样本来自二点分布总体X , X -b(1,p1),样本 来自二点分布总体Y -b(1,p2),两样本独立,要对参数P1与P2进行比较(判断两种不同加工方式,导致的总体合格率是否有差异,进而选定加工方式或者判定加工方式为影响因素)     
4、 配对数检验 
    其实实质为两个服从正态分布的均值比较,比较简单,可以看红宝书有介绍,这里就不做介绍了。     
5、非参数检验
   检验可以分为两大类:参数检验问题和非参数检验问题。对于均值的检验、对于比率 检验等,这都是关于参数的假设检验。分布的正态 检验、数据的独立性检验、两总体 分布是否相同的检验 则是非参数假设检验。
   非参数方法的使用范围广泛、简便易行,同组数据,非参数检验 检出力会比参数方法稍小,因此,应该在条件允许的情 况 下 (确认分布为正态)尽量使用前面介绍过的参数方法。
    非参数检验举例如下:1、符号检验 ;2 曼 -惠 特 尼 -威 尔 科 克 森 检 验;3 威尔科克森符号秩检验;4、克鲁斯卡尔-沃利斯检验;5、数 独立性的链检验

二、样本量的计算及检出力
     对单总体均值进行假设检验时样本容量的确定,如果当样本量n 给 时,对立假设的均值μ越大,即两个总体的均 值之差越大,则两类错误的概率就越小。在假设检验中还常用到一个名词:功 效 (power),有时也称为检出力,它定义是1 一β, “在备择假设成立时拒绝原设”的概率,即可靠性。
    例:在总体和样本服从正态分布时,假设检验样本量或者检出力的是否合理的确认。
     统计上,均值之差与之比、样本量、β、α呈现固定等式,用minitab 计算样本容量或检出力,只要给出样本n、均值之差(样本μ-目标μ),标准差,给出三个参数,即可计算出第四个参数。
(检出力,一般为0.95,可以根据具体项目要求做调整,标准差未知时,用t 分布计算)
     其他分布比如t分布,P分布,双总体均值假设检验,minitab同样输入相应的参数可以计算出样本量或检出力。
三、相关分析与回归分析
       分析问题出现的原因是至关重要的,统计学中的相关分析及回归分析就是很有力的工具。如果同时获得了两个或多个连续型变量的观测值,就可以使用相关分析和回归分析。 例如,在一定的范围内,反应罐中的温度与最终产量间,就呈现某种关系。分析并确认 二者是否有关系,这就是相关分析的任务;把二者的关系用方程的形式表达出来,这就是 回归分析的任务。
      回归分析又分单自变量的回归(称为一元回 归)和多自变量的回归(称为多元回归),除了线性回归,还可能有二次回归、三次回归 等多项式回归
1、相关分析
      相关系数r (通常是指Pearson相关系数)是用来描述两个变量线性相关程度的一种度量。数学证明:一定有关系式:一l < r< l 或 |r | < l 。完全线性相关:r = ± l ,|r |越接近 1,则表明各个点靠近直线越近;反之程分散的状况。
    判断样本相关系数是否足够大的标准与样本量有非常密切的关系,无统一的标准。一般,样本量超过9 时,只要相关系数绝对值达到0.7,那么就认定两变量间是确实相关的;当样本量超过2 5时,只要相关系数绝对值达到0.4,那么就认定两变量间是确实相关的。可用minitab可以判断相关性
2、回归分析
    —元线性回归模型
   假 设 (X,Y)的散点图显示有直线关系,回归方程的显著性检验可以利用minitab 拟合检验 和建立一元方程,再利用残差分析诊断模型。如下为简单线性回归模型:
我们需要学习的重点不是如何画这些图,而是如何分析这些图。
   (1) 图1残差图:残差点应在横轴上下随机波动,不应有任何上升、下 降 、摆动、跳跃等趋势。如果有某种趋势存在,则说明数据观测过程中受到某个未知的因素的强大的影响,应该找出此因素并加以控制
   (2) 图2残差图:点应该分布在一条水平的带子中。如果在图中有明显的“喇叭口”形状,即表明残差的标准差不是常数,而是在随预测值而变化,这提示我们原来的模型假定可能有问题。如果有 “喇叭口”的形状,可以通过对Y 作变换加以解决。
   (3) 图4和图3残差图:
        用以判断残差是否在是正态分布,如果对正态性有怀疑,可以直接对
残差数据进行正态性检验。
     (4) 自变量残差图图6-17,
    此图分析的重点是看残差的标准差是否能保持常数(即 各 残 差 点 是 否 有 叭 口 ”)或是否有弯曲的形状。如果对y的预测值的残差图也不正常,首先考虑对y要做变换;而如果对y的预测值的残差图正常,这时说明在回归方程中仅有线性项不够,要增加x 的髙阶项或其他项。此图正常。
四、数据分析的3原则介绍:
     (1) 明确要深入了解的方向。正确的做法经常重新翻看项目任务书问题陈述,时刻牢记目标。
     (2) 不断提出假
     (3) 注意关于事件发生的频率、影响程度以及与问题缺陷症状相关问题。
    例子:新服务生招待的顾客是否比其他顾客抱怨得更多?(问题频率)
       新服务生招待的顾客抱怨什么?与有经验服务生招待的顾客抱怨相比,有何不同?   (观察到的问题)
       如果新服务生招待的顾客抱怨得更多,是否意味着这顾客将不太可能再次光顾?(问题的影响)

个人水平有限,如果有不之处,请评论私信,如觉得文章还不错,请点赞,转发,谢谢对编者的支持。微信公众号转发,请注明出处,谢谢。
本文章整理自《六西格玛管理》3版 何桢主编,如有侵权及时删除。
码文不易,赏小编一直棒棒糖吧。



【声明】内容源于网络
0
0
SQE供应商质量
美国APICS供应链知识体系和美国ISM供应链知识体系传播、最新供应链动态知识、供应链实货文章,定位为供应链知识专业公众号,传播供应链知识。
内容 65
粉丝 0
SQE供应商质量 美国APICS供应链知识体系和美国ISM供应链知识体系传播、最新供应链动态知识、供应链实货文章,定位为供应链知识专业公众号,传播供应链知识。
总阅读11
粉丝0
内容65