大数跨境
0
0

会计学顶刊JAR:大语言模型测量ESG指标!

会计学顶刊JAR:大语言模型测量ESG指标! 数据皮皮侠
2025-07-18
2

JEFFERSON ABRAHAM, MARCEL OLBERT, FLORIN VASVARI几位学者合作在会计学顶刊Journal of Accounting Research发表了一篇题为“ESG Disclosures in the Private Equity Industry”的文章,该研究通过创新性地分析全球私募基金公司22年的历史网站数据,首次系统揭示:投资者需求驱动其自愿ESG信息披露,且披露越多,其投资组合公司的实际ESG表现成果越好。

对大语言模型感兴趣的可以了解一下近期推出的《Python计算社会科学训练营:从0基础到机器学习与大语言模型进阶》,共设置Python结构化数据分析、网络数据采集、文本分析、机器学习、社会网络分析、大语言模型6个专题模块,含Management Science、Review of Financial Studies、Research policy等22个案例。

摘要

本报告提供了全球私募股权 (PE) 公司大量样本提供的关于环境、社会和治理 (ESG) 披露的首个系统证据。使用 2000 年至 2022 年的历史网站,我们开发并验证了一种基于字典的新型私募股权公司自愿 ESG 披露衡量标准。描述性统计数据揭示了这些披露的时间趋势,最近社会话题变得与环境话题一样重要。多变量分析表明,基金投资者对 ESG 信息的需求是私募股权公司 ESG 披露的重要决定因素。利用私募股权公司投资组合公司的数据,我们记录了更多的私募股权公司 ESG 披露与投资组合公司层面更好的 ESG 结果相关,这表明自愿 ESG 披露与普通私募股权公司的实际行动保持一致。



该研究首次系统解构了全球私募股权(PE)行业环境、社会及治理(ESG)信息披露的演化逻辑与实践效能。研究团队创新性地采集2000-2022年间PE机构历史网站数据,构建基于语义分析的词典测量框架,揭示了两个关键范式转变:在时间维度上,ESG披露强度呈现显著上升趋势,其中社会议题的讨论权重近年已比肩环境议题;在驱动机制上,基金投资者的信息需求成为PE机构自愿披露的核心动因。尤其值得注意的是,通过交叉验证PE投资组合公司在环保署毒物排放清单(TRI)、职业安全数据(OSHA)及Trucost数据库中的ESG表现,研究发现更高层级的PE机构披露与底层被投企业实质性的ESG改善存在统计显著的正向关联,这有力印证了行业披露行为并非停留于"漂绿"表象,而是切实推动了经营实践的转型。

这项研究的突破性价值,正体现在其与大语言模型技术范式的深度契合。面对跨越二十余年的非结构化网站文本,传统人工编码方法几乎难以实现全局分析。而研究者开发的词典测量工具,本质上可视为LLM文本挖掘能力的先驱应用——通过构建专业术语网络捕捉语义特征,实现对海量披露内容的自动化解构与量化。这种基于自然语言处理(NLP)的方法论创新,使研究者能够穿透宣言式表述的表层,精准识别"清洁技术投资""员工安全协议"等实质性议题的披露演变轨迹。更关键的是,当研究将PE机构宣言与其投资组合的监管数据库记录进行多源匹配时,LLM驱动的实体链接与关系抽取技术成为验证"言行一致性"的核心基础设施,这直接支撑了"披露驱动实质改进"这一颠覆性结论的诞生。

该成果标志着LLM技术正在重塑实证会计研究的疆界。当传统研究受限于结构化财务数据时,此项工作通过对网站历史快照、监管文本、企业ESG报告等多元异构数据的智能融合,开辟了"非财务信息披露-实体行为验证"的研究新路径。研究团队公开的预处理数据集与匹配逻辑,更为LLM在另类数据分析领域的应用提供了标准化范本。正如PE行业通过ESG披露重构资本流动方向,这项研究也预示着一个新趋势:基于语言模型的文本智能,正成为解码商业社会复杂信号的关键透镜。

文献来源:

Abraham J, Olbert M, Vasvari F. ESG disclosures in the private equity industry[J]. Journal of Accounting Research, 2024, 62(5): 1611-1660.



【声明】内容源于网络
0
0
数据皮皮侠
社科数据综合服务中心,立志服务百千万社科学者
内容 2137
粉丝 0
数据皮皮侠 社科数据综合服务中心,立志服务百千万社科学者
总阅读2.3k
粉丝0
内容2.1k