内容选取自彭健教授所著
《母猪营养代谢与精准营养》第十章。
原创内容,欢迎转发,务必注明信息来源。
描述性统计,是指运用制表和分类、图形以及计算概括性数据来描述数据特征的各项活动。描述性统计分析要对调查总体所有变量的有关数据进行统计性描述。对于不同类型变量,常用的描述性统计分析方法和参数不同。对于连续变量/离散变量,常用的描述性统计分析方法(参数)包括频数分布分析、集中趋势、离散程度和数据分布形态等;对于分类变量,常用的描述性统计分析方法包括频数分布分析和交叉列联表分析。另外,描述性统计分析也包括以图的方式呈现数据的结构和特征(伍云山,2010)。
统计学中的变量根据数据属性和特征大致可以分为数值变量与分类变量,变量类型特征的不同导致在进行描述性统计时采取的方式不同。其中,数值变量根据取值特点不同可以分为离散型变量(discretevariable)和连续型变量(continuousvariable)两类;而分类变量(Categoricalvariable)则可根据分类多少以及分类后变量有无顺序之分,分为二分类变量(如是否、有无和男女等)、有序多分类变量和无序多分类变量三类(Yang,1997;李晓松,1998)。
分类变量是指被测量的量(即被测属性的可能变化状态)是有限数量的不同值或类别的数据。分类变量的可能状态至少有两类,这些类别是相互区别排斥,并且共同包括所有个体。
当分类变量的状态只包含两类时,称为二分类变量。在母猪生产中,常见到的二分类变量包括母猪分娩(是/否)、仔猪存活(是/否)和仔猪腹泻(是/否)等指标。

从本期开始,泛德公众号将开始陆续介绍一些养猪生产中常用的统计方法。本期我们首先从最基本的描述性统计开始,然后从养猪生产中记录的指标所属的数据类型出发,分别介绍了分类变量、离散型变量和连续型变量。下一期我们将继续介绍数据分布特征和常用的描述性统计量,敬请大家期待。

