大数跨境
0
0

继顶刊RFS后,《金融研究》也用文本分析测量企业文化,超细致!

继顶刊RFS后,《金融研究》也用文本分析测量企业文化,超细致! 数据皮皮侠
2025-04-27
2

金融学顶刊The Review of Financial Studies的Measuring Corporate Culture Using Machine Learning ,作者为Kai Li, Feng Mai, Rui Shen, Xinyan Yan,文章系金融会计文献首次用神经网络量化公司披露文本,对量化文本具有非常重要的参考价值。
使用最新的机器学习技术之一——词嵌入模型和209,480份收益电话会议记录,创建了一个文化词典。在2001-2018年期间,通过62,664次公司年的观察,评估了创新、诚信、质量、尊重和团队合作等五种企业文化价值观。结果表明,创新文化比通常的企业创新指标——研发费用和专利数量更广泛。 
诺丁汉大学商学院(中国)华秀萍、程思睿李婉宁以及北京大学新结构经济学研究院王勇的《非正式融资中的文化力量——企业文化对商业信用的影响》《金融研究》中发表,文章基于 A 股上市公司文本数据,运用词向量等机器学习模型,提炼中国企业文化维度、构建特色词典,度量文化强度。我们将在《上市公司年报文本分析科研实操》中对其进行方法复现。
数据说明
采用上市公司年度报告中 “董事会报告”“经营情况讨论与分析”“管理层讨论与分析” 这三个模块的文本内容。
文本处理
获取年报文本后,用Python与预训练词典相结合进行分词。
文化维度确定
从 2818 家 A 股上市公司官方网站人工收集企业文化相关文本并清洗,通过 K -Means 算法文本聚类结合人工判断,从官方网站文本中聚类得到 13种企业文化维度及相关种子词,其中 “道德”“创新”“勤勉”“质量” 与 “合作” 文化是被最多上市公司提及的 5 种企业文化,故选用这 5 种文化维度代表企业文化。
企业文化词典构建

基于企业文化五个维度,通过词向量模型与夹角余弦向量距离扩展种子词库,为每个种子词赋予对应词向量,按维度对种子词词向量平均化处理得到各文化维度平均词向量,将词向量赋予年度报告文本中所有出现过的词汇,采用夹角余弦距离算法计算各词汇词向量与各文化维度平均词向量的相似度,保留前 3000 个相似度最高的词汇,经人工检查筛选去除无关词汇后形成企业文化词典。

文化强度测度
基于 TF-IDF 算法对年度报告文本中各维度企业文化词汇词频进行全文比重加权统计,得到各文化维度的企业文化强度指标。
来源文献
Li, Kai, et al. "Measuring corporate culture using machine learning." The Review of Financial Studies 34.7 (2021): 3265-3315.

华秀萍,程思睿,李婉宁,等.非正式融资中的文化力量——企业文化对商业信用的影响[J].金融研究,2023,(10):186-206.


【声明】内容源于网络
0
0
数据皮皮侠
社科数据综合服务中心,立志服务百千万社科学者
内容 2137
粉丝 0
数据皮皮侠 社科数据综合服务中心,立志服务百千万社科学者
总阅读615
粉丝0
内容2.1k