内容选取自彭健教授所著
《母猪营养代谢与精准营养》第十章。
原创内容,欢迎转发,务必注明信息来源。
大多数统计分析方法要求总体是服从正态分布的前提下才能应用,因此需要用偏度和峰度两个指标来检查样本数据是否符合正态分布。偏度系数(Skewness)是描述数据某变量取值分布的对称性。0为正态分布;大于0为正偏或右偏,长尾在右边;小于0为负偏或左偏,长尾在左边。而峰度系数(Kurtosis)是描述其变量所有取值分布形态的陡峭程度。0为正态分布,大于0为陡峭,小于0为平坦。一般情况下,如果样本的偏度接近于0,而峰度接近于3,就可以判断总体的分布接近于正态分布。当总体是非正态分布,或当分布未知时,依据中心极限定理(Central limit theorem,CLT)可以认为原来不服从正态分布的一切独立的随机变量,当随机变量的个数无限增加时,它们之和的分布趋于正态分布,这一理论给我们的计算带来很大的方便(杨桂元,2000)。
数据的集中趋势分析可以反映一组数据向某一位置聚集的趋势,主要的统计量有算数平均数(Arithmetic mean)、几何平均数(Geometric mean)、中位数(Median)和众数(Mode)。算数平均数适用于正态分布和对称分布的数据,中位数适用于所有类型。如果各个数据之间差异程度较小,用平均数就有很好的代表性;而如果数据之间的差异程度较大,特别是有个别的极端值的情况下,用中位数或众数有较好的代表性。


