大数跨境
0
0

顶刊RFS:公司金融实证研究P值操纵与补救

顶刊RFS:公司金融实证研究P值操纵与补救 数据皮皮侠
2022-11-02
1
导读:9种显著性操纵方法

来自美国杨百翰大学的学者Todd Mitton于2021年在金融顶级期刊The Review of Financial Studies发表论文《Methodological Variation in Empirical Corporate Finance》,文章回顾顶级金融期刊上公司金融领域诸多的实证方法,探讨了统计显著性经济显著性的权衡。针对方法上的多样性可能带来的p值操纵问题,文章展开详细讨论并提出一些应对措施供以参考。

Todd Mitton, Methodological Variation in Empirical Corporate Finance, The Review of Financial Studies, Volume 35, Issue 2, February 2022, Pages 527–575

注:想要获得此文章的PDF文档请在公众号后台回复关键词 “ 金融实证 ”。更多与社科因果推断、文本、音像、网络结构数据挖掘、机器学习、网络爬虫相关的学术资源交流,请关注“社科学术汇”公众号,后台回复“社群”添加


在研究过程中,具有统计显著性的结果在研究人员和出版商两个方面通常都具有发表优势。第一个方面,研究人员更希望得到统计上显著的结果,从而认为这是可信的、有意义的、重大的研究发现,这种做法被Harvey(2017)称为“p-hacking”(P-hacking 最早由美国宾夕法尼亚大学的Simmons和他的团队提出,指统计分析数据时采用不同的方法直到P<0.05,很容易引起假阳性结果)。第二个方面,出版商可能会对统计上显著的结果,即具有“重大发现”的论文存在偏好


作者收集了2000年至2018年间发表在Journal of Finance, Journal of Financial Economics和Review of Financial Studies三本顶级金融期刊上的604篇文章、954个回归,研究调查发现,最常见的6个被解释变量分别是:盈利能力、公司价值、杠杆率、投资、支出和现金持有(profitability, firm value, leverage, investment, payouts, or cash holdings)。这六类回归在2000年到2018年期间大幅增加,数量从8个增加到89个,即使按照期刊发表论文总数进行调整,这些回归出现的概率也增加了7倍多。

以这六类回归作为调查样本,发现公司金融文献在实证方法上存在很大差异,关键来源为:被解释变量的选择缺乏共识、控制变量的使用几乎没有一致性、文献对大多数实证设定中没有达成共识的趋势(如排除金融业、异常值处理、滞后变量、连续/离散变量)。


这种方法的多样性是否与统计显著性之间有关系吗?作者检验了不同设定方式的选择对于回归系数显著性的影响。文章的模拟结果表明,显著性可以通过变化方法来实现,至少有很大可能得到1颗星,也就是可以通过方法改变操纵P值,比如:

1) 寻找更多被解释变量的代理变量

2) 替换或增减控制变量

3) 剔除部分行业,如金融业

4)(被)解释变量用对数值

5) 解释变量从连续型转成离散型

6) 解释变量使用滞后值

7) 缩尾、截尾或保留异常值

8) 从1%缩尾改变成5%缩尾

9) 比例型被解释变量换分子或分母


针对实证设定的多样性可能带来的p-hacking问题,本文从三个方面提出了补救措施:

第一,稳健性检验——通过设定其他方法来证明结果的稳健性;

第二,规范检查——对所有可能的设定方式进行回归并报告结果;

第三,关注经济意义——作者对统计显著在传统实证研究中的重要地位(“p-hacking”)提出了挑战,指出我们应当更加强调和注重经济意义。


其实类似的争论已经持续多年,学者们通常具有两种态度——放弃p值或谨慎使用p值。显然第一条道路过于激进且困难重重,对第二条道路的探索是更加合理的。可以说这篇文章为我们提供了一个谨慎对待p值的思路。作者向我们表明具有统计显著的实证结果并不足以证明其是重要的(Statistical significance is not sufficient to establish that an empirical result is important)。同时,未来学者在公司金融实证研究中,应当更加注重评价经济显著性,在统计意义与经济意义二者之间取得平衡。



END

往期内容


01

科研数据 

中国高速铁路线路&城市高铁开通数据

地级市面板数据1990-2019

上市公司数据集-慈善、股权、研发、审计、高管

地级市高新技术企业统计情况2000-2019

 碳交易、碳排放(分行业、国家、省、市、县)

2008-2018中国上市公司政治关联原始数据

1936-2018年全国县级以上干部数据

地级市市长市委书记数据库

上市公司2006-2018年资产负债收益

各县接收上山下乡知青数量

832国家级贫困县摘帽数据

疫情以来各省市新冠疫情日度数据采集视频

公募基金从业资格数据2.7万条

企业数字化转型数据-两种计算方式&附参考文献

面板数据40年:过去、现在及未来

空间计量stata模型-空间杜宾模型-检验&结果解释

31省&274市政府经济发展注意力配置数据

31省 & 274市政府“安全议题”注意力面板数据

31省&274市政府“财政治理”特征面板数据



02

学习资料 


 文献利器EndNote教程(视频-PPT)

 SCI完整写作攻略

北大空间计量经济学讲义

博士研究计划范文

空间权重矩阵和杜宾模型案例数据及分析

三阶段DEA模型理论与操作手册视频讲解

SPSS统计分析与行业应用案例详解

R语言学习资料

20套学术答辩PPT模板

实证分析大全

Fama-French五因子模型数据和Stata代码

Stata17 win和mac版

Stata17MP版最新使用指南全书

时间序列分析入门
实证研究只是一条路径并非捷径
盘点提供数据代码的国内外期刊
空间统计及软件资源
100个学术网站合集

03

期刊投稿经验 


《北京行政学院学报》期刊投稿经验分享
《国际论坛》投稿经验分享
《北京航空航天大学学报(社会科学版)》投稿经验分享
《证券市场导报》期刊投稿经验分享
《东北师大学报(哲学社会科学版)》投稿经验分享
《中国人民大学学报》投稿经验分享
《世界经济文汇》投稿经验分享

《管理世界》等30家CSSCI期刊投稿声明!

全面总结几篇金融C刊被拒(刊)的说法

经管北大中文核心期刊投稿方式汇总表

10本经济学刊物投稿经验分享,看完受益匪浅!


04

计量统计 

2022年经济学&管理学学术会议大合集

2022年考研经管类调剂汇总

Stata常用命令
2022年应用统计调剂院校部分汇总
大数据时代下的数量经济学应用
2022年应用统计调剂院校部分汇总
实证研究的诀窍——因果识别
Stata:动态面板数据操作及应用
使用Stata进行双重差分(didregress和xtdidregress)
江艇:因果推断经验研究中的中介效应与调节效应
2022年《数量经济技术经济研究》与《中国工业经济》2篇必读因果推断论文

终于有综述把因果图方法原理和应用规则写清楚啦!


05

科研论文 


100个学术网站合集

发表英文期刊的经验

经济学最新CSSCI目录
本科、硕士生可投递的期刊
SCI的撰写技术
优秀论文的铁律
学位论文写作30忌
224本社科C刊最新投稿详细指南汇总
C刊最新目录大合集(4月9-15日)
经济学权威期刊:编辑部偏爱、关系稿有影响吗
C刊目录大合集
2万字审稿意见回复在经济学顶刊上发表了
近年《管理世界》使用机器学习文本分析论文
汇总整理50本好发的SSCI期刊
18万字解读C刊论文最常用100个理论
对《管理世界》《经济研究》等论文年报词频测度数字化方法的质疑
温忠麟教授2篇“中介效应”论文知网被引破万,居中文期刊论文被引TOP2
经管中文论文被引TOP3,均来自《经济研究》
近年《管理工程学报》机器学习文本分析论文
近年《会计研究》机器学习文本分析论文


06

前沿文献 


顶刊论文:解决内生性问题的24种方法!
【顶级期刊目录】JFE 2022年9月目录
《管理世界》2022年第7期目录、摘要
《管理世界》2022年第9期 目录与摘要
Journal of Financial Economics 2022年10月刊论文 目录与摘要
顶刊《世界经济》2022年第9期论文 目录与摘要
American Economic Review2022年第9期论文 目录与摘要
顶刊《金融研究》2022年第8期论文 目录与摘要
RFS金融学研究评论2022年8月刊论文摘要10篇
《数量经济技术经济研究》2022年第10期目录及摘要
顶刊MS:首次基于文本挖掘衡量公司创新,优于专利、研发费用衡量方式!
《会计研究》2022年第5期论文
顶刊JAE:会计研究实证方法演进
The Quarterly Journal of Economics 2022年第4期论文
更多资源请关注公众号获取
↓  ↓  ↓  ↓  ↓  ↓

【声明】内容源于网络
0
0
数据皮皮侠
社科数据综合服务中心,立志服务百千万社科学者
内容 2137
粉丝 0
数据皮皮侠 社科数据综合服务中心,立志服务百千万社科学者
总阅读2.6k
粉丝0
内容2.1k