大数跨境
0
0

种猪生产大数据分析方法之描述性统计(续)

种猪生产大数据分析方法之描述性统计(续) 武汉泛德信息技术有限公司
2022-07-25
2
导读:内容选取自彭健教授所著《母猪营养代谢与精准营养》第十章。原创内容,欢迎转发,务必注明信息来源。一、数据的分布

内容选取自彭健教授所著

《母猪营养代谢与精准营养》第十章。

原创内容,欢迎转发,务必注明信息来源。

一、数据的分布特征


大多数统计分析方法要求总体是服从正态分布的前提下才能应用,因此需要用偏度和峰度两个指标来检查样本数据是否符合正态分布。偏度系数(Skewness)是描述数据某变量取值分布的对称性。0为正态分布;大于0为正偏或右偏,长尾在右边;小于0为负偏或左偏,长尾在左边。而峰度系数(Kurtosis)是描述其变量所有取值分布形态的陡峭程度。0为正态分布,大于0为陡峭,小于0为平坦。一般情况下,如果样本的偏度接近于0,而峰度接近于3,就可以判断总体的分布接近于正态分布。当总体是非正态分布,或当分布未知时,依据中心极限定理(Central limit theorem,CLT)可以认为原来不服从正态分布的一切独立的随机变量,当随机变量的个数无限增加时,它们之和的分布趋于正态分布,这一理论给我们的计算带来很大的方便(杨桂元,2000)。




二、数据的集中趋势分析


数据的集中趋势分析可以反映一组数据向某一位置聚集的趋势,主要的统计量有算数平均数(Arithmetic mean)、几何平均数(Geometric mean)、中位数(Median)和众数(Mode)。算数平均数适用于正态分布和对称分布的数据,中位数适用于所有类型。如果各个数据之间差异程度较小,用平均数就有很好的代表性;而如果数据之间的差异程度较大,特别是有个别的极端值的情况下,用中位数或众数有较好的代表性。




三、数据的离散趋势分析


离散趋势分析是指描述观测值偏离中心位置的趋势,反映一组数据背离分布中心值的特征。离散趋势分析主要的统计量有方差(Variance)、标准差(Standard deviation)、极差(Range)、最大值(Maximum)和最小值(Minimum)



四、交叉列联表分析


交叉列联表分析法是一种以表格的形式同时描述两个或多个变量的联合分布及其结果的统计分析方法,根据自变量个数的多少,列联表又可分为一维列联表和多维列联表。通过对列联表进行假设检验,研究者关心的是实际观测值和零假设条件下理论期望值之间的关系。具体来说,一维列联表评价的是观测值在某一类别变量的不同水平上的分布是否与某个既定的分布一致。多维列联表评价的是多个类别性变量对数据的交叉分类是否存在相互关系。交叉列联表分析易于理解,便于解释,操作简单却可以解释比较复杂的现象,在市场调查中应用非常广泛。频数分布一次描述一个变量,而交叉表可以同时描述两个或多个项目



让数据创造价值



【声明】内容源于网络
0
0
武汉泛德信息技术有限公司
武汉泛德信息技术有限公司,2021年02月05日成立,经营范围包括一般项目:信息技术咨询服务;大数据服务;软件开发;数据处理和存储支持服务;数据处理服务;人工智能理论与算法软件开发;与农业生产经营有关的技术、信息、设施建设运营等服务
内容 63
粉丝 0
武汉泛德信息技术有限公司 武汉泛德信息技术有限公司,2021年02月05日成立,经营范围包括一般项目:信息技术咨询服务;大数据服务;软件开发;数据处理和存储支持服务;数据处理服务;人工智能理论与算法软件开发;与农业生产经营有关的技术、信息、设施建设运营等服务
总阅读118
粉丝0
内容63