大数跨境
0
0

【众筹】Fama-French五因子模型数据和Stata代码(2000-2022年)

【众筹】Fama-French五因子模型数据和Stata代码(2000-2022年) Paper数据分析
2023-08-17
0
导读:数据说明数据区间:2000-2022年(原始数据区间1990-2022年)数据格式:dta(Stata 14

数据说明



  • 数据区间:2000-2022年(原始数据区间1990-2022年)

  • 数据格式:dta(Stata 14/15/16)

  • 无风险利率采用一年期定期存款利率

  • 市值指标选择流通市值(根据需要可以修改)

  • 市场回报率采用流通市值加权平均法计算,考虑现金红利再投资的综合月度市场回报率(数据里有几种可供选择)


  • 月个股回报率使用考虑现金红利再投资的月个股回报率



数据处理说明




  • 规范信息披露制度下上市公司年度财务报表一般在次年3、4月份公布,且在一季度财务报表公布之前披露,即4月底为年报披露截止期。财务报表信息披露的滞后性造成金融数据库中财务数据与市场数据的时间不一致,即t年末的财务数据因年报公布的滞后性在t+1年4月份披露财务报表时才得到更新。因此选取t年5月至t+1年4月作为组合构建周期

  • 市场类型选择:全部A股,包括沪深主板、中小板和创业板

  • 剔除IPO后前六个月的数据包括上市月)  (以下筛选条件根据自己需求修改)

  • 剔除ST(特别处理)、*ST(退市风险警示)、PT(特别转让)股票

  • 剔除金融行业股票

  • 剔除账面价值为负的股票

  1. * 中国A股市场所有股票, 包括沪深主板、中小板和创业板 科创板 北交所

  2. * 市场类型数值含义:1=上海A,2=上海B,4=深圳A,8=深圳B,  16=创业板, 32=科创板,64=北交所。

  3. keep if inlist(市场类型, 1, 4, 16, 32)


  4. * 选择2000-2022年数据

  5. keep if year>=2000 & year<=2022


  6. * 剔除IPO后前6个月的数据(包括上市月)

  7. gen month_gap=m-上市月份

  8. drop if month_gap<6


  9. * 剔除ST、*ST、PT

  10. drop if 是否ST或PT==1


  11. * 剔除金融类股票

  12. drop if regexm(行业代码C, "J")

复制代码


  • 中国股市中市值最小的 30% 的上市公司会受到壳价值污染的严重影响,所以剔除市值最小的30%



参考文献





  • 李志冰, 杨光艺, 冯永昌,等. Fama-French五因子模型在中国股票市场的实证检验[J]. 金融研究, 2017

  • 赵胜民, 闫红蕾, 张凯. Fama-French五因子模型比三因子模型更胜一筹吗——来自中国A股市场的经验证据[J]. 南开经济研究, 2016

  • Liu J , Stambaugh R F , Yuan Y . Size and Value in China[J]. Journal of Financial Economics



分组指标




  • 规模指标(Size):第t-1年12月底的流通市值作为规模指标;

  • 账面市值比(BM):第t-1年末的账面价值,除以第t-1年12月底股票i的流通市值

  • 利润(OP):第t-1年末的营业利润 /股东权益合计

  • 投资风格(Inv):用第t-1年末相对于第t-2年末的总资产增加额,除以第t-2年末的总资产



因子构建(2x3分组)




  • 规模的分组点为中位数,前50%为小规模组(S,Small),后50%为大规模组(B,Big)

  • 账面市值比的分组点都为第30个和第70个百分位数,前30%为低账面市值比组(L,Low),中间40%为中账面市值比组(N,neural),后30%为高账面市值比组(H,High)

  • 将市值和账面市值比两个指标交叉, 可把全体股票分成SH、SN、SL、BH、BN、BL 六个组合

  • 分别以营运利润率和投资风格代替账面市值比,重复上述步骤, 可把全体股票分成 SR、SN、SW、BR、BN、BW、SC、SN、SA、BC、BN、BA 这12个组合, 其中营运利润率前30%为盈利疲软组(W,weak),中间40%为盈利中等组(N,neural),后30%为盈利稳健组(R,robust);投资前30%为投资保守组(C,conservative),中间40%为投资中等组(N,neural),后30%为投资激进组(A,aggressive),接下来计算上述各组合每一期的市值加权平均收益率;

  • 最后, 利用不同组合收益率之差构造四个因子。


  • 分25组回归的时候计算组合收益率采用流通市值加权平均法计算的组合收益率



表格展示





Fama-French五因子25组投资组合收益率,并用Newey-West t统计量检验市值最小组和最大组的差异


五因子描述性统计  


五因子相关性分析

利用其他四个因子回归解释第五个因子


RMW与SMB的相关系数高达0.568,RMW与CMA的相关系数高达0.592,而且RMW用其他四个因子的解释程度达到0.671,所以正交化利润因子RMWO替代利润因子RMW,进行后续的回归分析。

GRS检验结果
其中A|a|, 为第 i 个股票组合回归截距项的绝对值


分25组回归Stata生成结果表


Fama-French五因子分25组回归结果(Excel已设置好公式,只需要Stata生成的结果复制进去可以自动生成表格,标注星号,方便快捷




附件下载





数据文件


结果输出文件

众筹服务介绍

   本公众号致力于帮助大家低成本快速获取科研资源,成立以来在粉丝数量和好评数量方面迅速节节攀升。为了更好服务粉丝,在读者建议下推出数据众筹服务。

众筹背景:

  某些平台上的科研资源价格高,动辄几百几千,给个人客户造成经济负担较重。本公众号主要粉丝为学生党和高校教师,人数多,需求集中,比较适合采用众筹模式降低人均购买成本。

众筹模式:

 目前有以下两种众筹模式:

  方式一:公众号不定期发布带有【众筹】标识的资源介绍,包括资源内容、原价截图、拼团人数等信息,有意向拼团的读者可私信客服1文末快捷留言,达到拼团目标人数后由小编组织进行众筹获取

  方式二:读者可将想要从其他平台购买的资源链接、介绍、价格发送给客服1,我们将通过公众号发布推送等方式募集同样需要此数据的读者并进行众筹募集。

如需获取,请添加客服1微信

   

数量有限,先到先得,目标人数2-3人,价格4-5折左右

报名拼团请添加文末客服1,达到目标人数后众筹获取。


如有以下需求请直接点击红字链接
数据资源
开通会员
学术指导
爬虫服务
Paper

Paper



资源获取方式

加客服1

更多资源,点击下方阅读原文

【声明】内容源于网络
0
0
Paper数据分析
资源分享、科研辅导、数据分析等干货基地
内容 136
粉丝 0
Paper数据分析 资源分享、科研辅导、数据分析等干货基地
总阅读0
粉丝0
内容136