大数跨境
0
0

Science:大语言模型对劳动力市场的潜在影响

Science:大语言模型对劳动力市场的潜在影响 数据皮皮侠
2025-06-23
1

图源自AI:ChatGPT


参考文献:

Eloundou, T., Manning, S., Mishkin, P., & Rock, D. (2024). GPTs are GPTs: Labor market impact potential of LLMs. Science (American Association for the Advancement of Science), 384(6702), 1306–1308.



摘要

我们提出了一个框架,用于评估大型语言模型(LLM)及相关技术对工作的潜在影响,该框架通过考量这些技术与劳动者在工作中执行任务的相关性来展开分析。通过应用此框架(同时结合人类评估和LLM自身评估),我们估算出约1.8%的工作中,超过一半的任务可能会受到具备简单界面和通用训练的LLM的影响。而当考虑到当前及未来可能出现的、与LLM能力形成互补的软件开发时,这一比例跃升至46%以上的工作。诸如生成式预训练Transformer(GPT)等LLM的共同属性强烈表明,它们具备其他“通用技术”(GPT,General-Purpose Technologies)的关键特征。我们的研究强调,需要进行全面的社会评估并制定政策措施,以应对LLM及互补技术对劳动力市场的潜在影响。

我们考量了LLM能力的进步及其催生的互补技术的潜在广度,并强调要最大化LLM的影响力,需将其整合到更广泛的系统中。我们开发的评估准则定义了任务对LLM的“暴露度”,这一思路延续了此前量化机器学习暴露度的研究。遵循既往文献,我们将“暴露度”概念作为潜在经济影响的代理指标,不区分劳动力增强或替代效应。我们的方法不同于通用技术讨论中对互补创新的广泛范畴,更聚焦于先进软件能力,而非业务流程再造、新无形资产创造或劳动力再培训的潜力。历史上,像电力或计算技术这样的通用技术曾产生深远影响,且其效应历经数十年才完全显现。鉴于LLM展现出通用技术的潜力,我们呼吁在进行长期预测时保持谨慎,同时勾勒出工作可能发生变革的方向。


研究数据

1.职业与任务数据

-使用O*NET职业信息网络研究数据库,涵盖1016个职业及其详细工作活动(DWAs)任务,重点分析了有可用任务信息的923个职业。

2.就业与工资数据

-来自美国劳工统计局(BLS)2020年到2022年的职业就业系列数据。

DWAs(详细工作活动)描述了代表某一职业内所从事工作的更广泛活动。例如,“执行销售或其他金融交易” 这一DWA可能与一系列职业相关联。工作任务则是与一个或多个DWA相关联的更具体的工作单元,比如 “发送已完成交易和发货的电子邮件确认” 这一任务。O*NET将工作任务分为 “核心” 或 “补充” 两类,在该分析中,后者的权重为前者的一半(或另有说明)。结果对于替代权重方案具有稳健性。


核心发现

一、LLMs对任务的影响程度

基础暴露(E1):仅使用LLM或简单界面时,约14%的职业任务可实现50%以上的时间节省。

全集成暴露(E1+E2):当LLM与互补软件完全集成后,这一比例升至46%-55%,意味着近一半的职业任务可能受LLMs显著影响。

中间场景(E1+0.5×E2):若互补技术部分实施,任务暴露率可达30%-34%,显示技术迭代对影响范围的放大效应。

二、职业暴露的结构性特征

高暴露职业:涉及文本/代码生成、常规信息处理的职业(如律师、药剂师、数据库管理员)暴露度最高,尤其是需要“大量准备”的O*NET职业区域4到5的职业。

收入相关性:高工资职业比低工资职业更易受影响,暴露率与年薪呈正相关。

技术依赖性:仅依赖通用LLM时暴露有限,但加入领域特定软件后,任务暴露率可翻倍(如E1为14%,E1+E2达46%),凸显互补技术的关键作用。

三、自动化与劳动力市场的复杂关系

完全自动化潜力低:仅有1.86%的任务可被LLMs完全自动化,但71%的任务至少部分组件可由LLM辅助完成。

替代与增强并存:高暴露职业的自动化风险与劳动力增强潜力正相关(解释55.6%的方差),挑战了“AI仅替代或仅增强工作”的单一论断。

四、对研发与创新的影响

研发密集型职业优先受益:“科学家与研究人员”、“技术专家”等职业暴露度最高,LLMs可能通过提升研发生产力,推动下游产业创新。

通用技术特征:LLMs具备“通用目的技术(GPTs)”属性,其影响可能像电力、计算技术一样,需数十年逐步渗透并重塑经济结构。

五、政策与社会影响建议

监测与投资:需紧急投入资源跟踪LLM接受度及其劳动力市场影响,为政策制定提供数据支撑。

过渡政策设计:建议通过工资保险、失业保障改革等工具缓解劳动力冲击,确保技术红利普惠分配。

技术伦理导向:呼吁AI实验室与政府合作,引导LLMs发展向社会有益方向,避免加剧不平等。

六、研究局限性

方法边界:基于任务暴露的分析未考虑新任务创造、资本深化等长期效应,也无法直接预测劳动力需求的均衡变化。

AI评估不确定性:GPT-4的任务分类受提示词、模型版本影响,需更多职业专家验证以提升准确性。

未来预测挑战:LLMs的涌现能力和技术进化路径存在高度不确定性,需持续动态研究。

(由于篇幅有限,具体研究方法请阅览原文)


最后,如果您对该文章中的研究方法以及所用到的职业数据感兴趣,可以联系我们购买获取最新整理的O*NET职业信息网络数据库,我们收录了当下及过去的所有版本并进行分类还有整合在一起,从2000年到2025年,提供中英文版本


我们整理的O*NET数据包含了“DWAs(详细工作活动)”,“工作任务”等相关围绕其展开的数据,这些数据是这篇研究中的核心关键数据。感兴趣者请联系客服获得小样本。





【声明】内容源于网络
0
0
数据皮皮侠
社科数据综合服务中心,立志服务百千万社科学者
内容 2137
粉丝 0
数据皮皮侠 社科数据综合服务中心,立志服务百千万社科学者
总阅读615
粉丝0
内容2.1k