摘要
文献来源:Xi Dong, Yan Li, David E. Rapach, & Guofu Zhou. (2022). Anomalies and the Expected Market Return. Journal of Finance, 77(1), 639-681.
推荐理由:本文探讨了股票收益率横截面异象和时间序列预测之间的关系。本文考察了基于100个多空异象组合收益率对市场收益率的预测能力。本文采用了多种降维和机器学习方法,发现多空异象组合收益率中的信息确实可以增强对月度市场超额收益率的样本外预测能力,样本外R2可达2.81%,且经济意义显著。相对于随机漫步而言,基于异象组合收益率的预测可以显著降低预测误差。
本文提供了一个新的预测市场收益率的视角。理论上,本文将股票预测的两大领域(横截面和时间序列)联系了起来,并提出了解释预测效果的经济机制;实践上,本文发现了全新的市场收益率预测方法,这有助于投资者利用横截面信息改进对市场预测的效果。

1. 引言
在0.89%到2.81%之间,均超过了 Campbell 和 Thompson (2008) 提出的0.5%经济显著性阈值。根据 Clark 和 West (2007) 的测试,基于多空异象收益率的预测相对于现行平均值(即随机漫步漂移)的基准预测在降低平均平方预测误差(MSFE)方面具有统计显著性。此外,一个相对风险厌恶系数为3的均值-方差投资者愿意支付259到638个基点的年化投资组合管理费,以获得基于100个多空异象组合收益中信息的市场超额收益率预测。总的来说,关于基于各种收缩方法的样本外市场超额收益率可预测性的证据在统计和经济意义上均较强且稳健。
这一部分描述了本文进行样本外预测的主要方法。
假设需要预测市场超额回报率(
),并且本文有多个可能的预测因子;在本文的情境中,预测因子是100个多空异象组合的收益率。本文想要生成
。这是基于月份t的信息对月份t+1市场超额收益率做出的预测。本文所有的市场超额回报预测都是样本外的,因为本文只使用直到月份t的数据来预测
。
文献中最受欢迎的基准是平均值预测,这种预测的隐含假设是市场超额回报不可预测(除了其平均值)。现行的平均值预测只是在预测形成时使用市场超额收益率观测值的平均值。由于月度市场超额收益率中可预测的组成部分很小(即收益率数据相当嘈杂),很难击败现行平均值预测(例如,Goyal和Welch(2008))。所以,成功的样本外策略有效地使市场超额收益率预测靠近现行的平均值基准,以减少对收益率数据中噪声过度反应的可能性。
本文将现行平均值基准与以下总结的七个预测进行比较,每个预测都结合了预测因子样本的信息。
常规OLS:常规OLS预测基于包含所有滞后预测因子作为解释变量的拟合多元预测回归。尽管计算简单,但当预测因子数量较多时,常规OLS预测在实践中可能表现得很差。常规OLS估计在估计样本上最大化了模型的拟合度(即样本中的
),这可能导致样本内过拟合和样本外表现差,特别是对于高维模型。市场超额收益率中大的不可预测组成部分会加剧过拟合问题。
ENet:ENet预测基于多元预测回归的拟合,该回归是通过ENet而不是OLS来完成的。ENet(Zou和Hastie(2005))依赖于惩罚回归,以防止过拟合。ENet的惩罚项包括L1(LASSO)和L2(ridge;Hoerl和Kennard(1970))两个组成部分。L1组允许缩减到零,因此ENet可以进行变量选择。参照Flynn、Hurvich和Simonoff(2013),本文使用Hurvich和Tsai(1989)修正版的Akaike(1973)信息准则来选择控制收缩程度的正则化参数。ENet通过收缩拟合模型的斜率系数解决过拟合问题,这导致了预测值靠近现行平均基准的收缩。
简单组合:与其通过OLS估计多元预测回归,预测组合开始于基于OLS估计包含每个滞后预测因子(依次考虑)的单变量预测回归的一组预测。简单组合预测是单变量预测的算术平均值。Rapach, Strauss,和 Zhou(2010)显示,简单组合预测产生强烈的收缩效果。
组合ENet:当预测因子数量较大时,简单组合预测可能过于保守,意味着它过度地将预测收缩到现行平均值,从而忽视了预测变量中的大量相关信息。利用Diebold和Shin(2019)的见解,Rapach和Zhou(2020)以及Han等人(2021)使用ENet来改进简单组合预测。与其对所有单变量预测回归预测取平均,组合ENet(C-ENet)预测对ENet在Granger和Ramanathan(1984)的多元回归中选出的单变量预测取平均,该回归将实际市场超额回报与单变量预测相关联。
主成分:本文也可以通过从预测因子集中提取第一主成分来组合预测因子。主成分预测使用滞后的主成分作为OLS估计的单变量预测回归的解释变量。
PLS:第一主成分尽可能解释预测因子自身的变化。然而,从预测的角度看,本文关心的是解释目标变量。Kelly和Pruitt(2013, 2015)开发了一个三通道回归滤波器,而不是提取一个解释预测因子尽可能多变化的因子,这个滤波器从预测因子集合中构建了一个与目标变量最大相关的目标相关因子。然后将滞后的目标相关因子作为OLS估计的单变量预测回归中的解释变量。三通道回归滤波器实质上是PLS的一个版本。
本文考虑了横截面定价研究中100个最具代表性且可以通过使用CRSP、Compustat和I/B/E/S的公开数据进行复制的多空异象组合投资收益率。这些异象包含众多类别,如价值、成长、盈利能力、投资、动量和交易摩擦等。
对于每种异象,本文在每个月初按照相关特性对股票进行加权排序,形成10个组合。本文考虑了在纽约证券交易所、美国证券交易所和纳斯达克交易的所有股票,排除了价格低于5美元的股票。多空异象组合做多10个组合中的第10个组合,做空第1组合,其中做多(做空)的部分预计会产生相对较高(较低)的收益。本文排除了基于两个信号交互的异象(因为这样的异象在本质上属于多个异象)和基于指示变量(如IPOs)的异象。市场超额收益是CRSP市值加权收益减去无风险收益(也来自CRSP)。
样本区间是从1970年1月到2017年12月。图1报告了异象组合投资收益的描述性统计。在100个代表性异象中,有75个、71个、56个和49个在用Fama和French(1993)三因子模型调整收益后产生了t统计量(在数量级上)超过1.645、1.96、2.58和3的Alpha。任何两种异象十分位排名之间的平均相关性为0.05,这与McLean和Pontiff(2016)以及Green、Hand和Zhang(2017)的报告类似。因此,一只基于一种异象被认为是被高估或低估的股票,几乎有相等的机会被另一种异象认为是被高估或低估。这与Stambaugh、Yu和Yuan(2012、2015)以及Akbas等人(2015)的论点一致,即个别异象特性可能是股票定价错误的噪音指标。这也表明,聚合异象信息可以帮助减少个别异象中的噪声。
平均而言,任何两个异象的做多和做空组合收益高度相关(分别为0.76和0.82)。结合前面的理论分析,这可能反映了做多和做空收益中与错误定价无关的公共成分。相对而言,多空收益的平均相关性较弱(0.08)。这与个别多空异象收益中存在特有成分的观点一致。此外,多空组合投资收益的样本标准差平均值约为做空超额收益的70%,表明相比做空收益,多空收益提供了更敏锐的预测信号。
4. 样本外结果
图2描绘了基于100个多空异象组合收益和第3节策略的月度市场超额收益预测。传统的OLS预测具有很高的波动性。实际上,传统的OLS预测在一些月份的幅度超过6%(年化72%);如此极端的预测指向严重的过度拟合。其他预测的波动明显低于传统OLS预测的波动。换句话说,如作者预期的,ENet、简单组合、C-ENet、预测因子平均值、主成分和PLS策略将预测压缩向现行平均值(同时仍包含来自100个多空异象组合收益的信息)。简单组合预测施加了一个很强的压缩效应。在排除传统的OLS预测之后,PLS预测显示出最大的波动性,而ENet、C-ENet、预测因子平均值和主成分预测的波动性则介于简单组合和PLS预测之间。此外,图2中的市场超额收益预测通常在商业周期衰退期间具有更大的波动性,这表明多空异象组合收益本身在衰退期间具有更大的波动性。
图3报告了基于100个多空异象组合收益的月度市场超额收益预测的样本外
统计量。传统的OLS预测产生了数值很大的负样本统计量,证实这一预测受到了过度拟合的影响。与此形成鲜明对比的是,其他预测都产生了正的样本外
统计量,这意味着它们在1985年01月至2017年12月的样本外期间比现行的平均基准更为精确。使用Campbell和Thompson(2008)的0.5%阈值,六种用来防止过度拟合的预测的月度样本外
统计量在经济上都是显著的;事实上,ENet、C-ENet、预测因子平均值和PLS预测的样本外
统计量都相当大(分别为2.03%、2.81%、1.89%和2.06%),甚至为迄今为止文献中最高的一部分。此外,根据Clark和West(2007)的统计数据,六种用来防止过度拟合的设计产生的预测在MSFE上都提供了相对于现行的平均基准在统计上显著的改进。总的来说,本文发现,只要作者采用防止过拟合的预测策略,那么这100个多空异象组合收益中的信息对于预测月度市场超额收益就非常有用。ENet、简单组合、C-ENet、预测因子平均值、主成分和PLS预测都产生了在样本外准确性上具有统计和经济显著性的改进,这表明本文的结果是稳健的,且并未过度依赖于某一特定的防止过度拟合的方法。
图3还报告了基于多空异象组合收益中的多头和空头超额收益的月度市场超额收益预测结果。一个明显的模式是:空头超额收益提供了一些在统计和经济上具有显著预测能力的证据,而对于多头超额收益,没有在统计或经济上具有显著预测能力的证据。这一模式与套利限制的不对称性和相对于低估,高估更强的MCP相符。比较图3中多空和空头超额收益的结果,前者在预测月度市场超额收益上的表现优于后者。当多头和空头含有与未来市场超额收益无关的相当大的共同成分时,多空收益可以提供更加清晰的预测信号,因为多空收益过滤掉共同成分,产生了更少的被稀释的信号。
作者还衡量了异象组合收益预测能力的边际经济效益,以相对风险厌恶系数为3的均值-方差投资者,该投资者在市场组合和无风险国库券之间进行配置。图4描绘了根据100个异象收益进行市场超额收益预测的组合的对数累积超额收益。该图还描绘了根据现行平均基准预测的组合的对数累积超额收益,以及市场组合的对数累积超额收益。图4显示,将100个异象收益中的信息纳入的组合,通常表现优于基于现行平均基准预测的组合和市场组合。图4还显示了当投资者使用市场超额收益的竞争预测代替现行平均基准时的年化平均效用收益。对于基于100个异象收益的传统OLS预测(图中未显示),有一个大幅度的损失−4.97%,这进一步表现出传统方法的过度拟合问题。相反,设计用于防止过度拟合的预测都产生了大量的效用收益。简单的组合预测产生的年化收益率最小(2.59%),但这仍然在经济上是相当大的。PLS预测的年化收益率高达6.38%,基于ENet和C-ENet预测的年化收益率都超过600个基点(分别为6.26%和6.06%)。
尽管市场收益可预测性文献大多忽视了这一点,但评估平均效用收益的统计显著性是重要的。为此,本文使用了McCracken和Valente(2018)推荐的移动块自展程序来计算用于测试临界值。本文发现,基于ENet,预测因子平均,主成分(简单组合,C-ENet和PLS)预测的投资组合的效用收益在5%(1%)水平上是显著的。总的来说,效用收益进一步证明了异象组合收益包含了预测市场超额收益的有效信息。
对于基于ENet,C-ENet,预测因子平均,主成分,以及PLS预测的投资组合,异象收益中的信息对于改善大萧条后半段的预测表现尤为明显。值得注意的是,100个异象中的大多数异象在那个时间之前就已经被文献证明且被发表了,这表明由于异象群体中的信息而获得的效用收益并不限于异象未被发表出来的时期。
4.3. 其他结果
由于多头和空头异象收益是市场收益的组成部分,滞后的市场收益本身可能包含预测月度市场收益的相关信息。在1970年01月至2017年12月的样本期间,市场超额收益的自相关性为0.08(在10%的水平上显著)。然而,在1985年01月至2017年12月的样本期间,滞后的市场超额收益并未表现出显著的样本外预测能力。这并不令人惊讶,因为市场收益是一个比多空异象组合收益更为嘈杂的预测因子。
接着,本文探讨了选择用于预测市场超额收益的多空组合收益对结果影响。本文选择了Yan和Zheng(2017)一文中使用的超过18,000个多空组合收益,这些收益是通过利用来自Compustat的个体公司特性数据进行排序计算的。从全部多空组合收益中,本文形成了统计意义上alpha不显著和显著的两个子集。Yan和Zheng(2017)指出,具有高度显著的alpha的多空组合收益可能是有意义的异象,而不是数据挖掘的结果。本文从各自的子集中随机抽取100个多空组合收益。对于每个组,本文使用预测因子平均值从1985年01月开始生成样本外市场超额收益预测,并计算样本外
统计数据。重复这个过程1,000次,生成了基于随机选择的100个不显著和显著的多空组合收益的市场超额收益预测的样本外统计数据的实证分布。
图5呈现了两个多空组合收益子集的样本外
统计量的直方图。显著的多空组合收益对应的样本外
统计量集中在不显著的多空组合收益样本外
统计量的右侧。两个分布的平均值之间的差异(1.91)在1%的水平上是显著的。图5的直方图表明,显著的多空组合收益的组群通常会提高样本外市场超额收益预测的表现。总的来说,更可能构成异象的多空组合收益组群在预测市场超额收益方面更具信息含量,进一步证明了异象的重要性。
5. 非对称套利限制
5.1. 斜率系数
本文首先探究预测平均值、主成分以及PLS预测的预测回归模型中斜率系数的递归估计。这些预测回归为本文提供了用单一斜率系数来捕获所有100个多空异象组合收益中信息的便捷方式。
以预测平均值预测为例,其预测回归如下所示:
其中,
,而
是第i个异象的多空组合收益,i = 1, . . . ,n (n = 100)。
图6的a)到c)部分描绘了当解释变量为
,Zt,和Zt∗时,公式中标准化斜率系数的递归估计及其90%的置信区间。递归估计
始终为负,这与高估定价相较于低估定价更强的MCP是一致的。正如预期的,随着样本数量的增加,90%的置信区间趋于收窄。对于预测平均值(主成分)回归,递归估计从90年代中期至晚期(2000年初)开始变得显著,并且此后保持显著;对于PLS回归,递归估计始终显著。从2000年初到晚期,图6的所有三个部分的递归估计都相当稳定。然后,它们在全球金融危机和随之而来的大衰退期间在幅度上变大,并在此后相对稳定,这表明自2000年初以来,非对称套利限制的重要性并未大幅度减小。
5.2. 市场细分
多空异象组合收益的预测能力的重要部分源于它们与市场回报的细分的领先-滞后协方差。为了深入了解这一机制,本文研究了多空异象组合收益和十分位超额收益之间的交叉自协方差。这使本文能够研究多空异象收益信息对与异象相关的市场不同细分的相关性。为了整合来自所有100个异象的信息,并构建不含重叠股票的市场细分,本文采取以下步骤。
在给定的一个月,本文按照每个异象特征(依次考虑)对股票进行排序。然后,本文取每只股票在异象中的平均排名;本文取平均排名是因为在给定的一个月,有些股票在某些特征上可能会缺少观测值。然后,作者根据股票的平均排名将股票排序为按市值加权的十分位组合,第一(第十)分位数是最被高估(低估)的股票。多空组合再次在第十(第一)分位组合中做多(做空)。
图7的a)部分绘制了十分位超额收益,用j = S,D2, . . . ,D9,L表示的
的估计值。所有的交叉自协方差都是负的。第一分位超额收益(
)与的协方差
最大,这意味着在空头部分,MCP似乎最为相关。然而,许多其他分位的超额收益与滞后的多空异象收益的协方差在常规水平上往往显著,这表明多空异象收益中隐含的定价错误对市场有重要影响。交叉自协方差从第一分位到第十分位趋于减小,第十分位超额收益(
)的交叉自协方差最小(并且在统计上无显著性)。
对于基于异象排名平均值构建的分位数,本文按照Lo and MacKinlay (1990)和Lewellen (2002)的方式可以得到多空异象收益和下个月市场超额收益之间协方差的精确分解:

第j分位的市值份额。

是前面的三分之一(0.65%)并且在统计意义上不显著。
5.3. 子样本检验
在本节中,本文根据代表套利限制不对称性的指标形成的异象子集,生成样本外预测。本文根据三个指标形成子集:买卖差价(BA),特质波动率(IDIO)和市值(SIZE)。对于给定的月份和异象特征,本文首先将股票以十分位为界分成10组,然后计算多头和空头股票的给定指标的平均值。然后,本文计算每个月的代理指标的多头平均值减去空头平均值。最后,本文计算1970:01至1984:12的差异的时间序列平均值。本文将买卖差价,特质波动率和规模代理指标的差异的时间序列平均值分别标记为DTSA-BA,DTSA-IDIO和DTSA-SIZE。
接着本文构建了BA-NEG,IDIO-NEG和SIZE-NEG(BA-POS,IDIO-POS和SIZE-POS)子样本,他们是DTSA-BA,DTSA-IDIO和DTSA-SIZE子样本中为负(正)的子样本。和本文以样本外预测结果为准的原则相一致,本文在确定子样本时排除了预测评估期的数据。具有较大买卖差价,较大特质波动率和较小市值的股票通常被视为具有较强的套利限制。因此,作者期望基于BA-NEG,IDIO-NEG和SIZE-POS的市场收益预测性强于分别基于BA-POS,IDIO-POS和SIZE-NEG的预测,因为前三个子样本代表了在其空头端相对其多头端有不对称强套利限制的异象。
图8报告了使用设计来防止过度拟合策略的不同子样本的样本外
统计数据。尽管买卖差价,特质波动率和规模作为套利限制的代理变量存在相当大的噪音,但结果基本支持不对称套利限制和MCP对于高估与低估定价的相关性。例如,Panel A报告了使用买卖价差形成的两个子样本的结果。BA-NEG子样本的样本外
统计量都是正的且大小相当,远高于Campbell和Thompson(2008)提出的经济意义阈值。ENet,C-ENet和PLS预测的样本外
统计量尤其大(分别为3.57%,3.65%和2.94%)。根据Clark和West(2007)给出的统计,基于BA-NEG子样本的六个预测值都具有传统水平上的显著性。对于每种预测策略,BA-POS子样本的样本外的统计量总是低于BA-NEG子样本的相应统计数据。BA-POS子样本的两个样本外
统计数据是负的,只有两个超过了0.5%的阈值。Panel A的结果与第一部分的直觉相符,空头端相对较强的套利限制产生了更大的市场收益预测性。基于特质波动率和市值的子样本的结果在Panel B和Panel C中分别传递了与Panel A中基于买卖价差的子样本相同的信息。图8的Panel D报告了BA-NEG,IDIO-NEG和SIZE-POS子样本的并集的样本外
统计量。这些子样本的所有样本外统计数据在统计上和经济上都是显著的。对于补集子样本,五个样本外
是负的,而正的统计量不具有统计上和经济上的显著性。另外,作者预期具有较强预测能力的子样本(并集)的样本外统计量总是大于作者预期具有较弱预测能力的子样本(补集)的样本外
统计量。
在原文献附录中,作者还通过双重排序构建了具有总体高套利限制和空头端的高套利限制不对称性的异象子样本。对于BA,作者首先确定具有相对低和高平均代理值的股票在多头和空头的异象(分别为BA-LOW和BA-HIGH)。对于每个BA-LOW和BA-HIGH子样本,作者分别构建了NEG和POS两个子样本。如上所述,结果基于BA形成了四个子样本(BA-LOW-NEG、BA-LOW-POS、BA-HIGH-NEG和BA-HIGH-POS)。为了简洁,作者将BA-LOW-NEG、BA-LOW-POS和BA-HIGH-POS子样本的合并为BA-REST组。然后作者比较BA-HIGH-NEG和BA-REST子样本的结果。以类似的方式,作者根据IDIO(SIZE)形成了IDIO-HIGH-NEG和IDIO-REST(SIZE-LOW-POS和SIZE-REST)子样本。作者预期BA-HIGH-NEG、IDIO-HIGH-NEG和SIZE-LOW-POS子样本将展现出比BA-REST、IDIO-REST和SIZE-REST子样本更强的预测能力,因为前三个子样本在总体套利限制和相对于其空头的不对称套利限制方面都较高。在原文献附录中的结果证实了作者的猜想。
5.3. 市场摩擦
如Gârleanu和Pedersen(2013年,2016年)以及Dong,Kang和Peress(2020年)所述,诸如有限风险承受能力和交易成本等摩擦,引导套利者缓慢地对定价错误作出反应,从而导致市场错配定价(MCP)。如果作者之前发现的收益可预测性是由于套利者在不对称套利限制和对高估定价相对于低估定价更强的MCP存在的情况下,缓慢地纠正定价错误所驱动的,那么在摩擦高的时期,多空异象组合收益应包含更多预测市场超额收益的相关信息。本文通过观察在摩擦高时期样本外统计量的增加,来研究这个问题。
本文参考了文献中对市场摩擦的各种代理。本文首先参考了Pástor和Stambaugh(2003年)对总体和变化流动性水平的研究。本文也考虑了特质波动率,这被广泛认为是短线套利的主要实施成本(例如,Pontiff(2006年))。本文首先根据Ang等人(2006年)的方法,计算出给定月份的个股特质波动率,然后计算出个股特质波动率的市值加权平均值。此外,本文使用交易噪音(Hu, Pan和Wang(2013年))追踪套利资本的短缺,并用短线费用(Asness等人(2018年))度量做空股票的成本。对于后者,本文再次将其汇总到市场级别,通过计算个股短线费用的市值加权平均值。
除了上述变量,本文还考虑了风险、不确定性和风险厌恶指数作为影响套利者风险承受能力的摩擦代理。本文沿用VIX,并使用Jurado, Ludvigson, 和Ng(2015年)的宏观经济、金融和现实不确定性指数,这些不确定指数是通过估计基于宏观经济和金融变量的动态扩散指数模型残差的随机波动序列来构建的。最后,本文考虑了Bekaert, Engstrom和Xu(2021年)共同估计的经济不确定性和风险厌恶指数。对于所有的代理变量,本文使用样本中位数来划分高摩擦和低摩擦。
图9报告了基于100个多空异象组合收益的市场超额收益预测,高摩擦和低摩擦体制下的样本外
统计量(百分比点)之差。和不对称套利限制和相对于低估定价更强的MCP的假设相一致,样本外
统计量在高摩擦时期几乎总是较高,并且增加的绝大多数经过Clark和West(2007年)提出的增强检验都是显著的。此外,样本外
统计量的增加幅度在经济上是显著的,由流动性变动、交易噪音和短线费用度量的摩擦产生的预测,超过了10个百分点。
5.3. 市套利交易
接下来,本文研究多空异象组合收益是否能预测套利者在整个市场的交易行为和市场全局新闻的基调。如果在第t月由多空异象收益度量的高估定价修正只是部分的,并在随后的月份继续在市场中传播,那么作者预期第t月的多空异象收益的增加将导致套利者在第t+1月整体市场净仓位(即,多头仓位减去空头仓位)的减少,这主要可能由他们的空头增加推动;作者还预期在第t+1月的市场全局新闻基调会更为负面。
本文首先研究套利者在整体市场的总体净仓位的变化,本文在构造净套利交易度量时遵循了Chen, Da, 和 Huang (2019)的方法。具体来说,本文计算了市场中所有股票的对冲基金的总体市值加权多仓,这些多仓是基于13F数据库中每季度报告的个股持仓计算的。Agarwal等人(2013)通过结合13F数据库和五个对冲基金数据库的信息来识别对冲基金。13F持仓数据覆盖了最大数量的机构投资者,因为所有拥有超过1亿美元13(f)证券投资自由裁量权的机构投资经理都需要报告这些证券的季度末持仓。一个提交13F报告的机构如果其主要业务是赞助和/或管理对冲基金,则根据来自各种来源(如机构网站,SEC文件,行业出版物和新闻文章)的信息,该机构被分类为对冲基金。本文的最终样本包括1710个独立的对冲基金。本文通过汇总各个股票的空头利益来构造市场中所有股票的价值加权做空仓位。一个股票在一个月的空头仓位是在当月15日或之前结算的未备兑的做空交易的总股数(来源于Compustat)除以流通在外的总股数(来源于CRSP)。本文使用每个季度的最后一个月的空头仓位来匹配对冲基金持仓的季度数据频率。样本期间涵盖了1980:1至2017:4。
由于对冲基金的总体多仓和空头仓位表现出一定的趋势,本文计算对冲基金的多仓和空头仓位与滞后四季度均值的偏差。Chen, Da, 和 Huang (2019)表明,多空套利交易度量之间的差异(即净套利交易)有效地汇总了套利者的行动。图10报告了预测回归的标准化斜率系数估计,这些预测回归将季度套利交易度量与滞后的多空异象组合收益相关联,其中本文使用了季度末最后一个月的多空异象收益。为了在单个斜率系数中捕获100个异象的总体信息,本文估计了以
、Zt, 和 Zt∗作为预测因子(依次考虑)的预测回归。第二列中净市场仓位回归的估计值都是显著的(在5%或1%的水平上)。同时,这些估计值都是负的,这意味着多空异象收益的增加会导致套利者减少他们在市场中的净仓位。系数估计值在经济上也是相当大的:预测因子的一个标准差的增加对应于净套利市场仓位(以价值加权流通在外股份计算)的4.81%到5.81%的减少。
图10的第三和第四列分别报告了套利者的多仓和空仓的结果。对于多仓(空仓)交易指标,系数估计值全部为负(正),表明套利者在多空异象收益增加的情况下,减少(增加)他们在市场中的多仓(空仓)仓位。对于空仓市场仓位的回归,所有的估计值都在5%的水平上是显著的,而对于多仓市场仓位的回归,所有的估计值都不显著。比较第三列和第四列的结果,空仓方面的系数估计值的绝对值比多仓方面的大,这与对高估定价更强的MCP相符。根据对第二列的净变化分解,净变化大约有三分之一来自多仓的减少,三分之二来自空仓的增加。最后,图10的最后一列报告了月度美国金融市场新闻基调的预测回归结果。新闻基调度量来自Calomiris和Mamaysky(2019)的文章,根据的是汤森路透的英文新闻文章。月度新闻基调是对美国金融市场话题的新闻文章中的词语基调差异的汇总。本文通过计算与滞后12个月的MA的偏差来消除新闻基调的趋势。为了将100个异象的信息合并到一个斜率系数中,本文再次估计了以
、Zt, 和 Zt∗作为预测因子(依次考虑)的预测回归。本文在估计预测回归前对因变量和预测因子进行了标准化。样本期间是1996:01至2017:12。
考虑到套利限制的不对称性产生相对强烈的高估定价修正持续性,本文预期多空异象收益的增加将导致下一个月的全局市场新闻基调更为负面;换句话说,公共新闻更有可能证明确认股票普遍被高估。图10最后一列的结果支持了这种推测。系数估计值都是显著的负数(在1%的水平上),在经济上也足够大:预测因子的一个标准差的增加会导致市场新闻基调下降0.32到0.36个标准差。总的来说,图10的结果与多空异象组合收益预测市场收益的观点一致,因为套利者正在逐步纠正全市场的高估定价。
6. 结论
往期链接
海外文献推荐:因子选股类
向下滑动查看往期链接
第185期:左尾动量:股票市场坏消息的不充分反应
第179期:价值股与成长股的久期——差异没有想象的那么大
第177期:Smart beta多因子构建的方法论:混合与整合
第174期:解决规模效应的问题
第173期:2018-2020年的量化危机:被大盘成长逼入绝境
第171期:Smart beta与多因子组合的最优混合
第170期:通胀错觉和股票价格
第164期:Smart beta 策略中的“肉”在哪里?
第163期:从实体经济角度对股市未来长期收益进行预测
第160期:因子的两种类型:基于因子组合的收益分解
第157期:在分散化收益的视角下Smart Beta是否仍然Smart
第154期:异象策略的相关性结构
第144期:价值因子已死?
第142期:ESG投资:从罪恶股到Smart Beta
第135期:货币政策敞口因子MPE
第108期:分析师的共同覆盖——动量溢出效应的根源
第99期:低PE,成长,利率:对估值的再思考——最聪明的投资回收期
第89期:盈利,留存收益,账面市值比在股票横截面收益中的作用
第52期:微观领先于宏观?非流动性对股票收益和经济活动的预测能力
第36期:一种新的公允周期调整市盈率(CAPE)预测方法
第25期:价格影响还是交易量:为什么是Amihud(2002)度量
第22期:价值、规模、动量、股利回报以及波动率因子在中国A股市场的表现
第13期:股票市场波动性与投资学习
第13期:社会责任共同基金的分类及其绩效的衡量
第13期:因子择时风险导向模型
第10期:利用信息因子解释回报
第10期:异质现金流和系统性风险
第9期:“打赌没有β”投资策略研究
第9期:利用条件信息理解投资组合的有效性
第8期:因子择时模型
第8期:优化价值
第7期:动量崩溃
第7期: 动量因子及价值因子在投资组合中的运用的实证研究
第7期:后悔的神经证据及其对投资者行为的影响
第6期:持续过度反应和股票回报的可预测性
第6期:五因子资产定价模型在国际市场上的检验
第5期:价值的另一面:毛盈利能力溢价
第5期:卖空比例与总股票收益
第4期:巨变的贝塔:连续型贝塔和非连续型贝塔
第4期:全球、本地和传染的投资者情绪
第4期:投资者更关注哪些因子?来自共同基金资金流的证据
第4期:总资产增长率与股票截面收益率的实证
第3期:Beta套利
第3期:前景理论与股票收益:一个实证研究
第3期:趋势因子:投资时限的信息能获得收益?
第3期:时变的流动性与动量收益
第2期:CAPM新视角:突尼斯和国际市场基于copula方法的验证
第2期:资本投资,创新能力和股票回报
第2期:风暴来临前的平静
第2期:资本投资,创新能力和股票回报
第1期:三因子与四因子模型对比与动量因子的有效性检验
第1期:五因子资产定价模型
第1期:多资产组合中的动量因子影响
第1期:基于插值排序标准化变量法和复杂变量的平衡分离树的多因子选股模型
海外文献推荐:资产配置类
向下滑动查看往期链接↓
第193期:债券收益下限与资产配置:债券在资产配置中所扮演的角色将于何时受到危及?
第188期:ESG的Alpha,Beta和Sigma:更好的Beta,额外的Alpha
第156期:资产配置vs.因子配置——我们能否构建一类两者兼顾的策略
第126期:利用Fama-French五因子模型的alpha进行行业轮动
第65期:通过VaR Black-Litterman模型构建FOF投资绝对收益组合
第56期:利用低风险现象增强Black-Litterman模型:来自韩国市场的证据
第26期:协方差矩阵的非线性压缩:当Markowitz遇见Goldilocks
第16期:将因子暴露映射到资产配置
第12期:构造有效收入组合
第12期:投资组合中股票数量是否会影响组合表现
第11期:对冲基金收益优化投资组合
第5期:集中投资与全球机构投资者业绩
海外文献推荐:事件研究类
向下滑动查看往期链接↓
海外文献推荐:投资者行为类
第159期:估计分析师预期偏差新方法——投资者是否过度依赖分析师预期
第16期:坏习惯和好方法
第11期:状态变量、宏观经济活动与个股截面数据的关系
第10期:条件夏普比率
第9期:强制清算,减价出售与非流动性成本
第7期:买方与卖方谁发起交易
第7期:后悔的神经证据及其对投资者行为的影响
第7期:排名效应和交易行为:卖出最差的和最好的,忽略其余的
第6期:持续过度反应和股票回报的可预测性
海外文献推荐:择时策略类
向下滑动查看往期链接↓
海外文献推荐:公司金融类
向下滑动查看往期链接↓
第152期:识别导致价值/成长溢价的预期偏差效应:一种基本面分析方法
第150期:细节决定成败:ESG数据的差异性与责任投资的意义
第12期:世界各地的资本结构决策:哪些因素重要
第11期:财务风险有多重要?
第3期:机构投资者对公司透明度和信息披露的影响
海外文献推荐:基金研究类
向下滑动查看往期链接↓
第162期:COVID-19期间共同基金的业绩表现与资金流动
第140期:价值平均策略、美元成本平均策略以及随机投资方式的收益对比——基于多场历史数据的实证检验
第74期:风格中性FOF:分散投资还是成本重负
海外文献推荐:其他
向下滑动查看往期链接↓
关注我们

风险提示:本报告内容基于相关文献,不构成投资建议。
注:文中报告节选自天风证券研究所已公开发布研究报告,具体报告内容及相关风险提示等详见完整版报告。
证券研究报告
《天风证券-金融工程:海外文献推荐第264期》
对外发布时间
2023年08月04日
报告发布机构
天风证券股份有限公司
(已获中国证监会许可的证券投资咨询业务资格)
本报告分析师
吴先兴 SAC 执业证书编号:S1110516120001
王鹏飞 联系人



点击“赞”或“在看”,及时获取最新推送

