多重填补法(mutiple imputation)是解决数据缺失问题的常用方法,它可以通过多次填补产生若干个完整数据集并用于综合分析。随着计算方法和软件技术的成熟,该方法也被越来越多地应用于生物医学、社会科学等领域。
方法概述
图1.多重填补法填补过程
常用多重填补的方法

R语言实现
library(mice) #加载mice包
data1<-read.csv("缺失数据.csv")#读入数据
impdat <- mice(data1,m=5,method=c("pmm"))#采用PMM法进行多重填补,m=5
summary(impdat)

data2<-complete(impdat,3) #以选择第三个填补数据集为例
summary(data1) #查看填补前结果
summary(data2) #查看填补后结果

小结
参考文献:
1.石福艳, et al., EMB多重填补法在横断面健康体检资料定量变量填补中应用. 中国公共卫生, 2019. 35(11): p. 1536-1539.
2.刘小莉, et al., 多重填补法在公共卫生调查研究中的应用. 中华医学杂志, 2019(46): p. 3675-3676-3677.
3.梁霞, 缺失数据的多重填补及其改进. 2007, 中南大学.
4.邹莉玲, 吴娟丽, and 李觉, 多重填补法在任意缺失随访资料中的应用. 中国卫生统计, 2015. 32(02): p. 221-223.
制作:董墨染、李佳莉、吴君乐
初审:龚德鑫、胡建雄
审核:肖建鹏、刘涛
指导:马文军
关于我们
邮箱:statisic@gdiph.org.cn
微信号:gdiph-stat

