大数跨境
0
0

中国家庭追踪调查(CFPS)数据库简介

中国家庭追踪调查(CFPS)数据库简介 数据皮皮侠
2024-12-12
1

参考文献



[1]孙妍,吴琼,张春泥.中国家庭追踪调查:设计理念及数据运用问题[J].调研世界,2024,(01):4-14.DOI:10.13778/j.cnki.11-3705/c.2024.01.001.
[2]谢宇,胡婧炜,张春泥.中国家庭追踪调查:理念与实践[J].社会,2014,34(02):1-32.DOI:10.15992/j.cnki.31-1123/c.2014.02.003.

一、数据简介


中国家庭追踪调查(China Family Panel Studies,CFPS)是北京大学中国社会科学调查中心(ISSS)实施调查,通过收集个体、家庭、社区等方面的微观调查数据库,采用计算机辅助调查技术开展访问,以满足多样化的设计需求,提高访问效率,保证数据质量,是北京大学和国家自然基金委资助的重大项目,也是国内最为权威的家庭层面微观调查数据库之一。CFPS常被用以反映中国社会经济、人口教育和健康等方面的变化,是相关学术研究和社会政策分析提供有效客观的数据基础。基于CFPS数据的若干研究广泛发表于《经济研究》《管理世界》等国内顶级期刊上。
CFPS重点关注中国居民的经济与非经济福利,包括经济活动、教育获得、家庭关系与家庭动态、人口迁移、身心健康等多种研究主题。2010年,CFPS在全国25个省/市/自治区正式实施基线调查,最终完成14960户家庭、42590位个人的访问。基线调查界定出的所有家庭成员及其今后新生的血缘/领养子女被定义为CFPS基因成员,是CFPS调查的永久追踪对象,每两年访问一次。CFPS调查问卷共有社区问卷、家庭问卷、成人问卷和少儿问卷四种主体问卷类型,并在此基础上不断发展出针对不同性质家庭成员的长问卷、短问卷、代答问卷、电访问卷等多种问卷类型。

二、研究团队


中国家庭追踪调查(CFPS)数据库首席负责人为谢宇教授,另有首席研究员3人,国际学术咨询委员会成员13人,项目办公室工作人员6人。

谢宇,社会学家,美国国家科学院院士、美国艺术与科学院院士和中国台湾“中央研究院”院士。现任美国普林斯顿大学社会学和国际研究Bert G.Kerstetter '66讲席教授、当代中国研究中心主任,北京大学讲座教授、社会研究中心主任,微信公众号“知识分子”创刊主编之一、编委会成员。

三、调查设计


1.抽样设计
CFPS 样本是一个采用内隐分层(implicit stratification)方法抽取的多阶段概率样本 (multi-stage probability sample),以减少调查的运作成本和考虑到中国社会的社会背景差异。调查的抽样目标是全国25个省/市/自治区(不包括港澳台地区以及新疆维吾尔自治区、西藏自治区、青海省。内蒙古自治区、宁夏回族自治区和海南省)的人口,其中辽宁、上海、河南、广东、甘肃作为大样本省(简称“大省”),其余20个省作为小样本省(简称“小省”)。具体抽样过程如下:
(1)第一阶段抽样:按照大小省的划分,分别将每个省的区(若为城市)或县(若为农村)构成一个抽样框。
(2)第二阶段抽样:在一阶段所得的抽样框内,按照官方行政区划资料抽取行政村/居委会。
(3)第三阶段抽样:使用地图地址法构建末端抽样框,并采用随机起点的循环等距抽样方式抽取样本家户。
2.问卷设计
CFPS 的主体问卷包括村居问卷、家庭成员问卷、家庭问卷、少儿问卷和成人问卷五类。调查在社区、家庭和个人三个层面进行。CFPS 采用模块化的设计方式,每个受访家户或个人的问卷内容根据其具体情况,由相关的不同模块组合而成。计算机辅助调查系统为我们在访问当中即时调用相关问题模块、建立个性化问卷提供了方便。


四、数据概览


五、使用说明


1.数据范围
CFPS包括多个不同层次的数据集,具体包括:社区问卷数据集、家庭问卷数据集、成人问卷数据集和少儿问卷数据集。为实现不同数据集之间的交互匹配,CFPS采用了以下的方法:
(1)标准化的抽样设计权数:每个数据集都有相应的抽样设计权数,这些权数用于调整样本以反映总体的结构,确保不同数据集在分析时的一致性。
(2)无回答调整权数:考虑到调查中可能存在的无回答情况,CFPS使用无回答调整权数来调整样本,以减少无回答带来的偏差。
(3)事后分层调整权数:CFPS还使用事后分层调整权数,根据2010年普查资料,按照城乡、家庭人口规模、年龄、性别等因素进行事后分层,进一步提高样本的代表性。
(4)唯一标识符:每个数据集中的记录都有唯一的标识符,这些标识符可以用来连接不同数据集中的记录。例如,家庭问卷数据库中的家庭标识符可以用来匹配同一家庭中成年和少儿问卷数据库中的记录。
(5)数据集之间的关联:CFPS的数据集之间通过家庭和社区的层次结构相互关联。例如,家庭问卷数据库中的记录可以通过家庭标识符与成人问卷数据库和少儿问卷数据库中的记录相匹配,而社区问卷数据库中的记录则可以通过社区标识符与家庭问卷数据库中的记录相匹配。
2.数据获取和使用说明
使用者可通过CFPS官方数据平台(https://cfpsdata.pku.edu.cn/)进行注册或登录;如官方数据平台处在维护期,也可以通过北京大学开放数据平台注册或登录(https://opendata.pku.edu.cn/dataverse/CFPS)。两个平台的用户账号不互通。若使用者在旧版CFPS数据平台已注册,可使用原账户和密码直接登录并下载数据;若为注册,则按提示注册成为新用户,审核通过后即可下载;北京大学学生或北京大学教职工可以使用校园卡账号和相应密码,直接登录新版数据平台, 但仍需填写个人信息后点击提交申请,审核通过后方可下载数据。
因数据库中数据的收集涉及到被调查者的隐私,数据较为敏感,为了最大程度地保护受访者隐私,CFPS数据实施分级共享机制。对于不涉及受访者隐私的问卷数据信息将放在CFPS公开数据中,用户们在CFPS数据平台上进行注册申请即可下载数据到本地电脑使用。而对于有可能标识出个人的姓名、省级以下具体地址、工作单位等识别信息,CFPS会从公开数据集中删除。
屏蔽相关信息的举措虽然可以保证受访者的信息安全,但对学术研究会造成一定困难。为了在保护受访者信息的前提下能尽可能满足学者研究的需要,CFPS特别对部分数据提供了限制性数据的申请方法。研究者们在注册成为CFPS数据平台用户后,可以根据需要申请使用以下三类限制性数据:区县宏观经济变量数据库、限制性数据机房和一般限制性数据申请表。
为了保障CFPS数据的安全,任何用户不得在CFPS公开数据或限制数据的基础上探索CFPS地市、区县、乡镇、村居的具体名称、国标码等相关信息,发表的论文中不得出现与省级以下地址相关的信息(包括地图上的数据点)。违规用户将被取消数据使用权限。

六、研究成果


[1] 宋弘,罗吉罡.特岗教师、乡村教育与人力资本代际流动[J].管理世界,2024,40(10):51-74. 
[2] 杨子砚,文峰.从务工到创业——农地流转与农村劳动力转移形式升级[J].管理世界,2020,36(07):171-185.
[3] 周广肃,樊纲,申广军.收入差距、社会资本与健康水平——基于中国家庭追踪调查(CFPS)的实证分析[J].管理世界,2014,(07):12-21+51+187.
[4] 黄薇,曹杨.常态化精准扶贫政策的完善:反福利依赖的视角[J].经济研究,2022,57(04):172-190.
[5] 徐佳,韦欣.中国城镇创业与非创业家庭消费差异分析——基于微观调查数据的实证[J].数量经济技术经济研究,2021,38(01):43-60.
[6] 李涛,方明,伏霖,等.客观相对收入与主观经济地位:基于集体主义视角的经验证据[J].经济研究,2019,54(12):118-133.
[7] 卢洪友,杜亦譞.中国财政再分配与减贫效应的数量测度[J].经济研究,2019,54(02):4-20.
[8] 甘犁,赵乃宝,孙永智.收入不平等、流动性约束与中国家庭储蓄率[J].经济研究,2018,53(12):34-50.
[9] 李任玉,陈悉榕,甘犁.代际流动性趋势及其分解:增长、排序与离散效应[J].经济研究,2017,52(09):165-181.
[10] 李永友,郑春荣.我国公共医疗服务受益归宿及其收入分配效应——基于入户调查数据的微观分析[J].经济研究,2016,51(07):132-146.
[11] 马光荣,周广肃.新型农村养老保险对家庭储蓄的影响:基于CFPS数据的研究[J].经济研究,2014,49(11):116-129.
[12] 陈永伟,顾佳峰,史宇鹏.住房财富、信贷约束与城镇家庭教育开支——来自CFPS2010数据的证据[J].经济研究,2014,49(S1):89-101.
[12] 宋弘,罗吉罡,黄炜.教育扶贫与人力资本积累:事实、机制与政策含义[J].世界经济,2022,45(10):3-27
[13] 陈昊,陈建伟,马超.助力健康中国:精准扶贫是否提高了医疗服务利用水平[J].世界经济,2020,43(12):76-101.
[14] 汪伟,吴坤.中国城镇家庭储蓄率之谜——基于年龄——时期——组群分解的再考察[J].中国工业经济,2019,(07):81-100.
[15] 李军,刘生龙.教育对健康的影响——基于中国1986年义务教育法的实证分析[J].数量经济技术经济研究,2019,36(06):117-134.
[16] 张川川,魏旭,黄炜.社会保障项目之间的相互作用:新型农村社会养老保险对医疗保险的挤出[J].经济学(季刊),2023,23(03):860-875.
[17] 吴贾,陈丽萍,范承泽.母亲收入、家庭氛围和子女人力资本发展[J].经济学(季刊),2022,22(04):1169-1192.
[18] 宋弘,罗长远.高房价会扭曲公众的价值观吗?——基于中国家庭追踪调查(CFPS)的实证分析[J].经济学(季刊),2021,21(05):1753-1772.
[19] 罗楚亮,陈国强.富豪榜与居民财产不平等估算修正[J].经济学(季刊),2021,21(01):201-222.
[20] 熊瑞祥,李辉文.儿童照管、公共服务与农村已婚女性非农就业——来自CFPS数据的证据[J].经济学(季刊),2017,16(01):393-414.
[21] 罗楚亮.我国居民收入分布与财产分布的极化[J].统计研究,2018,35(11):82-92.

顶刊数据展示

高级、永久会员数据展示

向下滑动查看




【声明】内容源于网络
0
0
数据皮皮侠
社科数据综合服务中心,立志服务百千万社科学者
内容 2137
粉丝 0
数据皮皮侠 社科数据综合服务中心,立志服务百千万社科学者
总阅读2.3k
粉丝0
内容2.1k