大数跨境
0
0

种猪生产大数据分析方法之多层统计模型(续)

种猪生产大数据分析方法之多层统计模型(续) 武汉泛德信息技术有限公司
2022-09-26
4

内容选取自彭健教授所著
《母猪营养代谢与精准营养》第十章。
原创内容,欢迎转发,务必注明信息来源。



多层统计分析模型(Multilevel Model)适合应用于分级结构数据的统计分析中。所谓分级结构,是指较低层次的单位嵌套于较高层次的单位之中。应用该模型能够解决以下问题:
1)确定哪些解释变量对结局变量发挥作用,分析影响程度大小;
2)研究高层次因素是否影响低层次因素,剖析影响程度大小;
3)分析低层次因素对相应变量的影响是否随高层次水平的不同而发生变化。

多层统计模型建模步骤


首先,需要计算组内相关系数(intra-class correlation coefficient,ICC),确定数据类型是否适合采用多层统计分析模型。组内相关系数=组间方差/(组内方差+组间方差);其中组内方差和组间方差可以根据建立的空模型,采用SAS (one-way random effect ANOVA)计算,两水平空模型方程如下:
yij=γ00+u0j+eij
其中,yij代表结局测量值,γ00代表总平均数,u0j代表组间均值的变异,eij代表残差。
组内同质表明组间异质,如果某数据集的ICC统计不显著,该数据则采用多元回归模型,不需要多层模型分析;如果ICC统计显著,则应考虑对其进行多层模型分析。





其次,将高水平(水平2)解释变量纳入空模型,用场景变量解释组间变异。纳入水平2场景变量后模型方程如下:
yij=γ00+γ01X1j+u0j+eij
其中,Yij代表结局测量值,γ00代表总平均数,γ01代表场景变量X1j斜率,u0j代表组间均值的变异,eij代表残差。
采用SAS (proc mixed method=REML covtest)查看该模型拟合过程迭代史,协方差参数估计,拟合统计量(—2倍限制对数似然值:—2 res log likelihood,—2LL;Akaike’s信息标准:akaike’s information criterion,AIC;有限样本校正AIC:finite-sample corrected version of AIC,AICC;贝叶斯信息标准:bayesian information criterion,BIC),固定效应估计值以及Ⅲ型检验结果,根据上述信息可以确定一个场景变量是否对结局测量产生影响,从而确定模型中是否引入该变量。





再次,将低水平(水平1)解释变量引入模型,引入多个水平1解释变量时,首先将这些变量视作固定效应,并且不考虑水平1和水平2的跨层交互作用,检验新模型拟合效果(以两个水平1解释变量为例)。纳入水平1解释变量后模型方程如下: 
yij=γ00+γ01X1j+β1A1j+β2B1j+u0j+eij
其中,yij代表结局测量值,γ00代表总平均数,β1和β2分别为水平1A1j和B1j固定斜率,u0j代表组间均值的变异,eij代表残差。
采用 SAS (proc mixed)查看该模型拟合过程迭代史,协方差参数估计,拟合统计量固定效应估计值以及Ⅲ型检验结果,与方程2中迭代次数、-2LL、AIC、AICC及BIC对比,确定新模型拟合效果。根据固定效应输出确定有显著影响的水平1解释变量。 
然后,检验水平1随机斜率。上一过程中引入水平1解释变量时视为固定效应,但实际应用过程中不能事先知道所引入变量是否随机,需要对每一个引入变量的斜率及其是否存在交互作用进行检验.采用SAS (proc mixed,TYPE=VC)进行探索性建模,根据结果输出的G矩阵及协方差参数估计来确定哪些水平1解释变量为随机效应或固定效应。





最后,检验水平1解释变量是否跨水平2变异。若在控制水平2场景变量的同时, 水平1解释变量具有随机斜率,那么就需要对水平1随机斜率进行检验,确定其是否存在跨层交互作用。该过程可采用SAS (proc mixed,MODEL主效应=水平2场景变量/水平1随机斜率)完成,输出结果中可根据信息标准统计量确定新模型拟合效果(王济川等,2007)。



让数据创造价值


【声明】内容源于网络
0
0
武汉泛德信息技术有限公司
武汉泛德信息技术有限公司,2021年02月05日成立,经营范围包括一般项目:信息技术咨询服务;大数据服务;软件开发;数据处理和存储支持服务;数据处理服务;人工智能理论与算法软件开发;与农业生产经营有关的技术、信息、设施建设运营等服务
内容 63
粉丝 0
武汉泛德信息技术有限公司 武汉泛德信息技术有限公司,2021年02月05日成立,经营范围包括一般项目:信息技术咨询服务;大数据服务;软件开发;数据处理和存储支持服务;数据处理服务;人工智能理论与算法软件开发;与农业生产经营有关的技术、信息、设施建设运营等服务
总阅读128
粉丝0
内容63