大数跨境
0
0

年报年年大不同?或许并非如此

年报年年大不同?或许并非如此 数据皮皮侠
2025-05-13
1

1913

MD&A文本相似度(2008-2023)


数据简介


管理层讨论与分析(Management's Discussion and Analysis,MD&A)是上市公司年报中由管理层撰写的核心内容,其通过分析公司财务状况、经营成果、风险因素和未来战略,向投资者传递关键决策信息。研究MD&文本相似度具有多重理论与实践意义。MD&文本相似度分析可有效识别“模板化披露”现象。若多家公司或同一公司不同年份的MD&内容高度趋同,可能暗示管理层存在敷衍披露、避重就轻的风险。MD&A文本相似度研究不仅是技术工具的创新,更是完善信息披露制度、优化资源配置效率的重要突破口。其价值在于构建“文本特征-管理层动机-市场反应”的逻辑闭环,为提升资本市场信息透明度提供量化支撑。本团队参考宋昕倍、陈莹、逯东、程杰(2024)的文章,按照如下步骤得出MD&A文本相似度:

首先遍历所有文件,找到所有年份的股票代码集合的交集,即所有年份都存在的上市公司数据;

然后对文本进行分词处理,分词过程中去掉阿拉伯数字和标点符号,使用潜在语义索引(Latent Semantic Indexing,LSI)余弦相似度计算法,计算得出当期MD&A文本与上一期MD&A文本的相似度;

数据来源

由数据皮皮侠团队人工整理,全部内容真实有效

时间跨度

2008-2023年

数据范围

上市公司管理层讨论(MD&A)数据库

数据形式

数据格式为Excel形式

数据指标

股票代码

股票简称

年份

年度相似度


数据展示

参考文献

宋昕倍,陈莹,逯东,程杰. 信息环境、上市公司增量信息披露与资本市场定价效率——基于MD&A文本相似度的研究[J]. 南开管理评论, 2024, 27(5): 30-39.

声明:本数据由数据皮皮侠团队整理,仅用于学术研究


永久会员数据展示

向下滑动查看


高级会员数据展示

向下滑动查看


数据引用格式

请您在任何基于“数据皮皮侠”数据库所产生的中文研究成果(含学术论文、公开发表的研究报告等)均包括以下表述或类似表述声明:

本研究使用的数据来自PPData数据库。

例如:文中使用的农业研究相关数据来自PPData农业研究数据库。

其中,“农业研究相关数据”替换成实际使用的数据名称。

请您在任何基于“数据皮皮侠”数据库所产生的英文研究成果(含学术论文、公开发表的研究报告等)均包括以下表述或类似表述声明:

The data used in this study came from PPData database.

The agricultural research data used in this paper are from PPData agricultural research database.

Where "agricultural research related data" is replaced with the actual data name used.

声明:本数据由数据皮皮侠团队整理,仅用于学术研究

资源获取

数据编号: 1913

1.点击公众号右上角三个点-设为星标

2.文章底部右下角点击”在看“图标

3.皮皮侠公众号后台发送数据编号,按照提示添加客服微信回复时间:周一至周五14:30-18:00)发送保留2小时截图(要有10个点赞哦)


会员可在网站上直接下载

输入网址 www.ppmandata.cn

可直接跳转至官网

方式一 

去官网购买:

www.ppmandata.cn

方式二

扫描左边二维码购买

往期热门数据推荐(点击跳转)

1、1715 供应链创新试点DID(2007-2023)

2、1712 城市生态韧性(2007-2019)

3、1711 农业数字化与绿色化(2012-2020)

4、1717 消费者投诉与上市公司匹配数据库(2018-2024.7)

5、1708 美股上市公司10-k年报(2003-2024)

【声明】内容源于网络
0
0
数据皮皮侠
社科数据综合服务中心,立志服务百千万社科学者
内容 2137
粉丝 0
数据皮皮侠 社科数据综合服务中心,立志服务百千万社科学者
总阅读16
粉丝0
内容2.1k