大数跨境
0
0

顶刊《世界经济》、AER顶尖测度大拓展!中国国民经济行业分类-行业技能互补性(2012-2024)

顶刊《世界经济》、AER顶尖测度大拓展!中国国民经济行业分类-行业技能互补性(2012-2024) 数据皮皮侠
2025-10-09
0

2034

顶刊《世界经济》、AER顶尖测度大拓展!中国国民经济行业分类-行业技能互补性(2012-2024)


数据简介


本数据是基于上回行业技能互补性顶刊《世界经济》、AER顶尖测度:行业技能互补性)做出的探索性拓展。

这里需重申,行业技能互补性,是吉萍等(2025)指出在生产环节中,某一行业里不同技能类型的劳动者之间相互配合、协同工作的程度。在技能互补性特征显著的行业,多元技能人才的有效配合成为提升生产效能的关键因素。以高新技术制造业为例,其生产过程需要工程师、技术操作人员、产品设计师等多元技能人才协同参与,而非依赖单一技能类型的劳动者。行业技能互补性水平与技能多样性需求呈正相关,当不同专业技能实现优化配置时,将产生更突出的协同增值效应。

因此,我们再度参考吉萍等(2025)方法,用来测算基于中国国民经济行业分类的行业技能互补性。与之前不同的是(只有2024一年度),本次测算的时间跨度被拓展到2012-2024。该计算方法是以行业内职业结构为权重对职业技能互补性进行加权,得到行业技能互补性程度。由于中国缺乏细分职业技能和行业内职业结构的数据,作者建议采用美国数据进行测算。

-O*NET职业信息研究数据库,该数据以问卷调查方式用一系列标准化、可测量的变量集刻画了不同职业的特征。我们采用CNPD团队所整理的O*NET数据进行测算,该整理版本所涵盖信息量最全,不论是跨年度还是特征数据,并且结构清晰,分类明确,适用于未来相关指标研究拓展。

-美国劳动统计局(Bureau of Labor Statistics,BLS)提供的NAICS行业内各职业就业人数数据,我们在此采用的是2012年到2024年每年的5月份版本,与此同时O*NET数据选择的是2012年到2024年每年8月份版本或是最接近于8月的版本,一方面是确保版本之间时间间隔严格达到年度差异,另一方面是达到双数据绝对平行时间配对;并作出一系列处理。

关于用美国数据构建的指标来反映中国的情况,张国峰等(2016)在对于行业沟通密集度指标的测算中,指出不同职业对沟通的需求强度是其自身固有的属性,这种属性在不同国家之间的差异并不大。其次,每个行业都有其独特的就业结构特点,行业内部各职业的就业人数通常存在较为合理的搭配比例,因此同一行业在不同国家的就业结构不会有显著差别。此外,通过 “就业比重排序” 重新构建的沟通密集度指标可以看出,因各国产业结构不同而产生的就业结构差异,对行业沟通需求强度的影响并不明显。综上所述,利用美国职业数据构建的沟通密集度指标,能够相对科学地反映中国各行业的沟通强度。同时强调,只要不同职业的就业比重在该行业内的排序不发生变化,即不存在“要素密集度逆转”(factor intensity reversal) ,该指标就适用于所有国家。

同时,Bombardini et al.(2012)也基于应用了美国相关数据构建了技能替代性、技能扩散度、技能互补性等指标,用来映射19个国家的情况。

上述两篇文献所构建的相关行业特征指标均采用O*NET数据库中的情境表(Context),里面所统计的各项与职业相关指数结果都是这些职业自身固有的属性,在不同国家之间差异并不大,因此是有测算中国的行业技能互补性的合理性;另外,本次拓展性尝试是基于一种假设,即不同职业的就业比重在各行业内的排序从2012年到2024年间不发生变化。

接下来是我们所采取的制作步骤:

1.吉萍等(2025)将O*NET数据中的人际关系→角色关系→工作互动→团队合作项下“与团队或团队中的其他人一起工作有多重要”的调查结果作为测度所需基础变量。因此,对应该路径,我们在O*NET数据中的情境表里,提取出各职业的工作情境要素为“与工作小组或团队合作或为其作出贡献”的样本(在该岗位中,与工作小组或团队合作或做出贡献有多重要?);需注意的是,工作情景要素的名称会随着时间而变迁,基本是多/少部分字词,但是本质意义不会变。为更精确提取,我们直接按照该要素所对应的工作情景要素ID‘4.C.1.b.1.e’进行提取,并从中筛选出维度名称为“情境”的观测值,结合所对应的评分数值(0-100),这指代在该年,该职业在这个情境要素下的通用评分,即该情境要素对于该职业的整体重要性。最终获得2003年到2024年的数据。

2.基于BLS提供的NAICS行业内各类职业的就业人数,测度行业内职业结构。

根据对该数据的观察,我们做出如下处理,以获得全美各NAICS四位数编码级别行业下每个职业的就业人数:

(1)起始,合并从2003到2024年的每年5月份版本数据

(2)先过滤出 AREA_TYPE 为‘1’的观测值,该指代全美统计

(3)接着过滤出 I_GROUP 为‘4-digit’的观测值,主要是因为该NAICS层级里的职业种类统计样本量最多,结构会很清晰详细

(4)然后过滤出 O_GROUP 为‘detailed’的观测值,因其对应的 OCC_CODE 是六位数编码层级,可对应ONET中 SOC职业代码 中的六位数编码层级;然而,由于2012年以前的BLS统计里O_GROUP 并未有‘detailed’的观测值,会造成不适配,不得不舍弃之前的年份版本,最终只保留了2012-2024。

注:由于BLS数据的限制,匹配时只基于前六位的职业类别,剔除后两位不为0的编码的职业样本,这样不会造成匹配混乱。

注:OCC_CODE中是包含SOC职业代码的

(5)此外,上回行业技能互补性顶刊《世界经济》、AER顶尖测度:行业技能互补性)的结果里,由于BLS数据的统计口径,部分NAICS的就业人数统计是基于三位数编码,包含其所囊括的下级四位数编码的就业人数,最终导致中国国民经济行业分类下诸如房地产业等大类,根据官方设置好的匹配标准,未能匹配对应的指数。这次我们做出调整尝试,基于年份拆分,解决了以上问题:

(6)最终提取出 YEAR、NAICS、NAICS_TITLE、OCC_CODE、OCC_TITLE、TOT_EMP

接着将整理后的BLS数据与所过滤筛选后的O*NET数据进行匹配,获得从2012年到2024年全美各NAICS四位数编码级别行业下每个O*NET职业对应的就业人数,以及对应的工作情景要素(与工作小组或团队合作或为其作出贡献)的分数。

通过每年行业内不同职业在就业中所占比重作为权重,测度行业内职业结构,并通过加权平均测算NAICS行业的技能互补性程度。

3.通过NAICS-ISIC-CIC对照表,得到CIC行业技能互补性程度,即基于中国行业的行业技能互补性程度。

先介绍下NAICS是北美产业分类体系,我们用的是2022版(最新);ISIC是联合国经济和社会事务部下属统计司制定的《所有经济活动的国际标准行业分类》(International Standard Industrial Classification of All Economic Activities),我们用的是Revision 4(最新版);对于CIC中国工业分类标准,我们采用《国民经济行业分类》(GBT 4754-2017)(按第1号修改单修订)。

上述分类指南皆为pdf格式,我们提取并转换为excel表格,并遵循各分类标准层级进行结构化处理,同时利用所转化为数据表后的NAICS-ISIC对照表,和GB/T-ISIC对照表,将所有分类标准匹配在一起。

需要注意的是,由于各分类体系下层级细分不一致,会导致最终匹配出现许多重复情况,进而会使得最终匹配结果中许多GB/T小类行业所对应的行业技能互补性会出现重复值,如下所示各分类对照:

最终我们得到了2012年到2024年中国国民经济行业分类-行业技能互补性:

需要强调的是,测度数据中出现空值,是因为原对应的BLS统计下的NAICS各级行业数据中,均未统计相关分类下的职业从业人数,这些是正常的。

数据来源

O*NET职业信息研究数据库(CNPD团队整理版本),美国劳动统计局(Bureau of Labor Statistics,BLS),《国民经济行业分类》(GBT 4754-2017)(按第1号修改单修订),联合国《所有经济活动的国际标准行业分类》,“North American Industry Classification System”,由数据皮皮侠团队人工整理,全部内容真实有效。

时间跨度

2012-2024

数据范围

中国国民经济行业分类

数据格式

excel形式

数据指标

年份

GB/T 门类代码

GB/T 门类

GB/T 大类代码

GB/T 大类

GB/T 中类代码

GB/T 中类

GB/T 小类代码

GB/T 小类

行业技能互补性

 


数据展示
分类数据在“过程附录”中

参考文献

[1] 吉萍, 蒋为, 阎丽. 劳动力通勤成本、技能互补性与城市出口比较优势[J]. 世界经济, 2025, 48(5): 3-31

[2] 蒋为, 周荃, 向姝婷, 李锡涛. 方言多样性、团队合作与中国企业出口[J]. 世界经济, 2021, 44(4): 103-127

[3] 张国峰, 王永进, 李坤望. 产业集聚与企业出口: 基于社交与沟通外溢效应的考察[J]. 世界经济, 2016, 39(2): 48-74

[4] Bombardini, M.; Gallipoli, G. and Pupato, G. “Skill Dispersion and Trade Flows.” The American Economic Review, 2012, 102 (5), pp. 2327‒2348.




声明:本数据由数据皮皮侠团队整理,仅用于学术研究



永久会员数据展示

向下滑动查看


数据引用格式

请您在任何基于“数据皮皮侠”数据库所产生的中文研究成果(含学术论文、公开发表的研究报告等)均包括以下表述或类似表述声明:

本研究使用的数据来自CNPD数据库。

例如:文中使用的农业研究相关数据来自CNPD农业研究数据库。

其中,“农业研究相关数据”替换成实际使用的数据名称。

请您在任何基于“数据皮皮侠”数据库所产生的英文研究成果(含学术论文、公开发表的研究报告等)均包括以下表述或类似表述声明:

The data used in this study came from CNPD database.

The agricultural research data used in this paper are from CNPD agricultural research database.

Where "agricultural research related data" is replaced with the actual data name used.

声明:本数据由数据皮皮侠团队整理,仅用于学术研究

资源获取方式


 数据编号  2034


永久会员 可在官网搜索对应编号免费下载

官方网站:www.ppmandata.cn


非高级会员或永久会员 可进入官网

索对应编号后在网页右上角通过数据元购买

以1533为示例:




【声明】内容源于网络
0
0
数据皮皮侠
社科数据综合服务中心,立志服务百千万社科学者
内容 2137
粉丝 0
数据皮皮侠 社科数据综合服务中心,立志服务百千万社科学者
总阅读615
粉丝0
内容2.1k