问题: 如何使用asreml进行固定因子的wald检验和随机因子的LRT检验?
代码如下:
library(learnasreml)data("repeatmodel.dat")data("repeatmodel.ped")dat = repeatmodel.datped = repeatmodel.pedhead(ped)head(dat)str(dat)# 固定因子wald检验: 不考虑随机因子library(asreml)m1 = asreml(LAYDATE ~ BYEAR + AGE + YEAR, data=dat)wald(m1)# 固定因子wald检验: 加性效应作为随机因子ainv = asreml.Ainverse(ped)$ginvm2 = asreml(LAYDATE ~ BYEAR + AGE + YEAR, random = ~ ped(ANIMAL), ginverse = list(ANIMAL = ainv), data=dat)wald(m2)# 判断随机因子:LRT检验--加性效应 + BYEARm3 = asreml(LAYDATE ~ AGE + YEAR, random = ~ ped(ANIMAL) + BYEAR, ginverse = list(ANIMAL = ainv), data=dat)wald(m3)# 判断随机因子:LRT检验--加性效应m4 = asreml(LAYDATE ~ AGE + YEAR, random = ~ ped(ANIMAL), ginverse = list(ANIMAL = ainv), data=dat)wald(m4)# LRT检验: BYEAR显著性model.comp(m3,m4)lrt.asreml(m3,m4)summary(m3)$varcomp
结果如下:
library(learnasreml)data("repeatmodel.dat")data("repeatmodel.ped")dat = repeatmodel.datped = repeatmodel.pedhead(ped)ID FATHER MOTHER1 1306 0 02 1304 0 03 1298 0 04 1293 0 05 1290 0 06 1288 0 0head(dat)ANIMAL BYEAR AGE YEAR LAYDATE1 1 990 2 992 192 1 990 3 993 233 1 990 4 994 244 1 990 5 995 235 1 990 6 996 296 2 990 2 992 21str(dat): 1607 obs. of 5 variables:ANIMAL : Factor w/ 469 levels "1","2","3","8",..: 1 1 1 1 1 2 2 2 3 3 ...BYEAR : Factor w/ 34 levels "968","970","971",..: 22 22 22 22 22 22 22 22 22 22 ...AGE : Factor w/ 5 levels "2","3","4","5",..: 1 2 3 4 5 1 2 3 1 2 ...YEAR : Factor w/ 39 levels "970","971","972",..: 23 24 25 26 27 23 24 25 23 24 ...LAYDATE: int 19 23 24 23 29 21 17 21 20 20 ...# 固定因子wald检验: 不考虑随机因子library(asreml)m1 = asreml(LAYDATE ~ BYEAR + AGE + YEAR, data=dat)ASReml: Tue May 28 17:54:30 2019LogLik S2 DF wall cpu20.4837 1532 17:54:30 0.020.4837 1532 17:54:30 0.0Finished on: Tue May 28 17:54:30 2019LogLikelihood Convergedwald(m1)Wald tests for fixed effectsResponse: LAYDATETerms added sequentially; adjusted for those aboveDf Sum of Sq Wald statistic Pr(Chisq)1 890547 43476 < 2.2e-16 ***BYEAR 33 4127 201 < 2.2e-16 ***AGE 4 5967 291 < 2.2e-16 ***YEAR 37 10478 512 < 2.2e-16 ***residual (MS) 20---codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1# 固定因子wald检验: 加性效应作为随机因子ainv = asreml.Ainverse(ped)$ginvm2 = asreml(LAYDATE ~ BYEAR + AGE + YEAR, random = ~ ped(ANIMAL), ginverse = list(ANIMAL = ainv), data=dat)ASReml: Tue May 28 17:54:31 2019LogLik S2 DF wall cpu16.5248 1532 17:54:31 0.014.2991 1532 17:54:31 0.011.5365 1532 17:54:31 0.09.1074 1532 17:54:31 0.08.2103 1532 17:54:31 0.07.9751 1532 17:54:31 0.07.9436 1532 17:54:31 0.07.9413 1532 17:54:31 0.07.9411 1532 17:54:31 0.0Finished on: Tue May 28 17:54:31 2019LogLikelihood Convergedwald(m2)Wald tests for fixed effectsResponse: LAYDATETerms added sequentially; adjusted for those aboveDf Sum of Sq Wald statistic Pr(Chisq)1 40784 5135.8 < 2.2e-16 ***BYEAR 33 741 93.3 1.156e-07 ***AGE 4 5710 719.0 < 2.2e-16 ***YEAR 37 10067 1267.7 < 2.2e-16 ***residual (MS) 8---codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1# 判断随机因子:LRT检验--加性效应 + BYEARm3 = asreml(LAYDATE ~ AGE + YEAR, random = ~ ped(ANIMAL) + BYEAR, ginverse = list(ANIMAL = ainv), data=dat)ASReml: Tue May 28 17:54:31 2019LogLik S2 DF wall cpu16.3796 1564 17:54:31 0.014.2386 1564 17:54:31 0.011.5460 1564 17:54:31 0.09.1373 1564 17:54:31 0.08.2336 1564 17:54:31 0.0 (1 restrained)8.0474 1564 17:54:31 0.0 (1 restrained)7.9822 1564 17:54:31 0.0 (1 restrained)7.9615 1564 17:54:31 0.0 (1 restrained)7.9552 1564 17:54:31 0.07.9526 1564 17:54:31 0.07.9524 1564 17:54:31 0.0Finished on: Tue May 28 17:54:31 2019LogLikelihood Convergedwald(m3)Wald tests for fixed effectsResponse: LAYDATETerms added sequentially; adjusted for those aboveDf Sum of Sq Wald statistic Pr(Chisq)1 40918 5145.4 < 2.2e-16 ***AGE 4 5760 724.3 < 2.2e-16 ***YEAR 38 10499 1320.2 < 2.2e-16 ***residual (MS) 8---codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1# 判断随机因子:LRT检验--加性效应m4 = asreml(LAYDATE ~ AGE + YEAR, random = ~ ped(ANIMAL), ginverse = list(ANIMAL = ainv), data=dat)ASReml: Tue May 28 17:54:31 2019LogLik S2 DF wall cpu16.7962 1564 17:54:31 0.014.5295 1564 17:54:31 0.011.7012 1564 17:54:31 0.09.1801 1564 17:54:31 0.08.2381 1564 17:54:31 0.07.9895 1564 17:54:31 0.07.9553 1564 17:54:31 0.07.9526 1564 17:54:31 0.07.9524 1564 17:54:31 0.0Finished on: Tue May 28 17:54:31 2019LogLikelihood Convergedwald(m4)Wald tests for fixed effectsResponse: LAYDATETerms added sequentially; adjusted for those aboveDf Sum of Sq Wald statistic Pr(Chisq)1 40918 5145.4 < 2.2e-16 ***AGE 4 5760 724.3 < 2.2e-16 ***YEAR 38 10499 1320.2 < 2.2e-16 ***residual (MS) 8---codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1# LRT检验: BYEAR显著性model.comp(m3,m4)model AIC BIC AIC.stat BIC.stat1 m3 5830.49 5846.5552 m4 5828.49 5839.200 better betterlrt.asreml(m3,m4)Likelihood ratio test(s) assuming nested random models.Chisq probability adjusted using Stram & Lee, 1994.Df LR statistic Pr(Chisq)0 1.0339e-06 < 2.2e-16 ***---codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
划重点:
1, wald和anova对于asreml是一样的, 因为asreml中有anova这个类, 可以调用aonva.asreml 进行wald检验
2, learnasreml是我编写的包, 安装方法:
devtools::install_github("dengfei2013/learnasreml")
3, LRT检验, 可以手动进行, 也可以使用lrt.asreml函数进行检验.
祝你成功.
下面是使用lme4的解决方案:
很多朋友写信问我, 像要知道固定因子的显著性和随机因子的显著性如何计算,他们使用的是lme4这个R包, 但是这个包使用anova时没有P值,还要手动计算, 随机因子也需要自己计算loglikelihood值, 然后使用LRT的卡方检验进行显著性检验, 其实lme4包有扩展的包可以非常友好的做这件事情.
1. 载入数据和软件包
##载入软件包和数据library(lme4)library(lmerTest)library(sjstats)library(learnasreml)data(fm)
2. 软件包介绍
lme4
R语言中最流行的混合线性包
结果不太友好, 所以才有下面两个包作为辅助
安装方法
install.packages("lme4")
lmerTest
主要是用于检测lme4对象的固定因子和随机因子,它有两个函数:
lmerTest::anova.lmerModLmerTest用于检测固定因子的显著性, 方差分析表采用III平方和的形式.lmerTest::ranova用于检测随机因子的显著性, 使用的是LRT检验, 给出的是卡方结果.安装方法
install.packages("lmerTest")
sjstats
可以计算R2
可以提取方差组分
安装方法
install.packages("lmerTest")
3. 使用lme4进行混合线性分析
模型介绍
固定因子: Spacing + Rep
随机因子: Fam
建模
固定因子: Spacing+Rep, 随机因子: Fam
fm1 <- lmer(h1 ~Spacing + Rep + (1|Fam), fm)
固定因子检验
anova(fm1) # 固定因子显著性检验

可以看到Spacing 和Rep都达到极显著
随机因子显著性检验
ranova(fm1) # 随机因子显著性检验,LRT

可以看到Fam达到极显著
计算R2
r2(fm1) # 计算R2R-Squared for Generalized Linear Mixed Model[34mFamily : gaussian (identity)Formula: h1 ~ Spacing + Rep + (1 | Fam)[39m Marginal R2: 0.116Conditional R2: 0.277
计算固定因子每个水平的P值
p_value(fm1) # 计算每个水平的显著性
| term | p.value | std.error |
|---|---|---|
| (Intercept) | 1.535094e-127 | 0.7915991 |
| Spacing3 | 4.957481e-09 | 0.5463546 |
| Rep2 | 2.886600e-01 | 0.8082299 |
| Rep3 | 7.443430e-08 | 0.8218056 |
| Rep4 | 1.720753e-10 | 0.7995633 |
| Rep5 | 4.635631e-01 | 0.7663026 |
提取方差组分
re_var(fm1) # 计算方差组分_sigma_250.7633345854535Fam_tau.0011.3168413429073
4. 使用asreml进行对照
建模
library(asreml)fm2 = asreml(h1 ~ Spacing + Rep, random = ~ Fam, data=fm,trace=F)
固定因子检验
anova(fm2) # 固定因子显著性检验, 这里anova 是anova.asreml

随机因子显著性检验
这里首先构建一个空模型, 然后使用LRT检验
fm_Null = asreml(h1 ~ Spacing + Rep, data=fm,trace=F)lrt.asreml(fm2,fm_Null) # 随机因子显著性检验LRT

summary(fm2)$varcomp[,1:2] # 方差组分

5. 关于混合线性模型计算R2
还有一个包叫MuMIn,也可以计算R2
library(MuMIn)r.squaredLR(fm1)#计算R20.217233511687581
6. 完整代码分享
# 混合线性模型, 如何检测固定因子和随机因子###载入数据library(lme4)library(lmerTest)library(sjstats)library(learnasreml)data(fm)str(fm)### 固定因子: Spacing+Rep, 随机因子: Famfm1 <- lmer(h1 ~Spacing + Rep + (1|Fam), fm)summary(fm1)anova(fm1) # 固定因子显著性检验ranova(fm1) # 随机因子显著性检验,LRTr2(fm1) # 计算R2p_value(fm1) # 计算每个水平的显著性re_var(fm1) # 计算方差组分### 对比asremlfm2 = asreml(h1 ~ Spacing + Rep, random = ~ Fam, data=fm)anova(fm2) # 固定因子显著性检验, 这里anova 是anova.asremlfm_Null = asreml(h1 ~ Spacing + Rep, data=fm)lrt.asreml(fm2,fm_Null) # 随机因子显著性检验LRTsummary(fm2)$varcomp[,1:2] # 方差组分library(MuMIn)r.squaredLR(fm1)#计算R2


