内容选取自彭健教授所著
《母猪营养代谢与精准营养》第十章。
原创内容,欢迎转发,务必注明信息来源。
采用传统的单一水平回归或者多步回归的方法会导致参数估计偏差。多层统计模型在分析此类问题时不需要均衡数据,也允许数据集中存在缺失值,并且还能够方便的处理时间变化协变量。因此,与传统回归模型相比更加灵活,更适合于分析具有层次结构的多层数据。
多层统计分析模型(Multilevel Model)适合应用于分级结构数据的统计分析中。所谓分级结构,是指较低层次的单位嵌套于较高层次的单位之中。应用该模型能够解决以下问题:1)确定哪些解释变量对结局变量发挥作用,分析影响程度大小;2)研究高层次因素是否影响低层次因素,剖析影响程度大小;3)分析低层次因素对相应变量的影响是否随高层次水平的不同而发生变化。(王济川等,2007)。
在数据统计分析过程中,往往会存在一些多水平的分层结构数据,这些数据一般都存在组内同质性或组间异质性,表明组内观察数据不满足相互独立性。采用一般统计模型会增大参数标准误估计的偏离。但是,多层统计分析模型则不要求观察数据相互独立,因此可以避免因数据的非独立性引起的参数标准误估计的偏离。
此外,通过多层模型分析还能够将结局测量中的变异分解成为组内变异和组间变异,因而还可剖析响应变量在高水平因素及低水平因素间的相对变异的情况(雷雳和张雷,2002)。当分析数据样本量异常大时,可能会导致有些组子样本量非常小,在处理这种稀疏数据时,多层模型分析时允许存在缺失值,因此该模型是适合于此类数据的重要统计方法;当数据具有纵向特征时,多层统计分析模型又可以用来研究纵向数据中结局测量随时间变化的发展轨迹(王济川等 2007)。

在养猪生产中,大规模、多场区的养殖生产数据具有明显的层次关系,猪只所表现出的性能不仅与猪自身的性能好坏有关,还与猪场管理特征、猪舍结构、猪场管理环境等密切相关。同时,母猪不同胎次数据、公猪的配种母猪数据、母猪窝内仔猪个体数据都存在着明显的组内同质性。
刘则学(2017)建立了以母猪产仔窝次为低层级、以猪场层次为高层级的两层次模型,分析了影响母猪产仔数和仔猪初生重的因素。结果发现,对于具有层次特征的数据进行分析,应选用多层线性模型,使用一般线性模型会造成分析结果的偏差。分析母猪产仔性能影响因素发现,品种、胎次等动物因素对母猪产仔数和仔猪初生重有显著影响;饲养管理水平和分娩季节对母猪产健仔数有显著影响。
在养猪生产研究中,目前国内多层次模型的应用研究仍然很少,原因可能在于:①常规营养研究受限于营养研究的特点,往往没有足够大的样本量或在营养研究中控制试验条件以排除品种、胎次、体况、来源、生产模式等的差异,使数据不具有层次特征;②数据信息搜集的难度和养猪生产模式制约了大生产数据被有效挖掘和分析。数据的零散性、复杂性、不完整、欠规范都制约了多层次模型在数据分析中的应用。

