
詹嘉林(以下简称JL) 聚宽投资产品负责人
01
投研体系是如何运行的?
流水线+任务制
JL:我们现在的投研流程有两个关键词,第一个关键词是流水线,第二个关键词是任务制。
流水线跟行业内很多同行相似,第一步在特征的开发、因子的提取上,然后是对因子的组合,这里面会运用到大量的机器学习的算法,然后是组合优化,后面还有交易执行。
在因子的挖掘上面,基本上各个部门都会涉及,偏不同的周期。再往下游会有AI 的模块。投研一部、二部、三部现在基本上都有做AI的同学,他们会去做相应的算法模型,以及信号优化。后面的风险控制,投研负责人高斯蒙也会参与很多,基本上是高总带着团队在一起做。
流水线的核心是找到大的GAP
JL:流水线的核心问题是要对收益和风险进行拆解,收益和风险的认知越深入,就可以拆解的越清晰。
高斯蒙很重要的一个工作就是,他会参与到投研的每个环节讨论Gap在哪?投研的提升方向要瞄准那些提升概率比较大的地方。通过流水线把问题拆解出来,每一个模块的目标就确定了。
任务制聚焦长期研究课题
JL:另一方面,投研的任务制也越来越明显,我们需要考虑一些更长期的研究方向,以及从公司层面需要突破的一些研究任务。
比如某一方面的认知提升,是可以复用到其他环节的,它有点像科研项目的一些重点课题。我觉得这两个是比较关键的。
02
投研体系是如何调度与协同的?
深入沟通+灵活调度
JL:因为研究员的精力是公司非常重要的资源,所以投研同事的投入方向,以及他们的研究方法基本上都要跟高斯蒙确认。必须保证研究员聚焦在一些大概率能做出较大增量的方向去投入。
这就涉及到,在具体的投研方法上是否能大概率出成果,公司之前是否已经尝试过,或者说还需不需要给一些支撑,这些都需要进行深入沟通,这也是很重要的一项工作。
高斯蒙的工作是比较灵活机动的。特别是流水线越往后的部分,比如说组合优化,这部分工作需要非常全面的信息,也需要非常强的协调,是很机动灵活的。哪一块的优先级比较高,他会马上迁移过去,协调相关的东西。
标准化交互界面 提高协同效率
JL:为什么要花很多时间去思考怎么拆?我们是希望能提升投研的整体效率。
我举个例子,以前的衔接方式,做因子开发的同学,他的因子往下游走,做信号的同学会去抽取,可能下游的同学发现新的因子在你那里很有效,但到我这怎么感觉一般?是不是这个代码有问题,是不是我调取它的方式有问题?等等的问题可能都出现了。这种频繁的交互,协同效率就会越来越低。
我们当时想解决的问题,就是研究人员有一个想法以后,我们希望这个想法能更快的被验证,他的东西产出以后,下游的人可以给他一个比较标准的交互界面。
2022年上线分布式因子计算平台
JL:因此从2022年就开始做一个事,我们开始做公司的分布式因子计算平台,通过一套更标准、更好的分工流水线、强大的IT系统来实现人和人更少的交互,上游和下游的交互变得越来越简单。研究人员可以更加专注于把某一个具体的环节搞定。
03
如何进行风险控制?
JL:每个赛道对于风险控制的方法手段会存在一些差异,在Alpha(股票多头)这一块的话,以指数增强为例,首先是要对齐我所跟踪的指数的一些特征,这些特征是行业比较主流的,聚宽也在用的。
控制风格暴露在合理范围
JL:比如说中证500指数,它在风格上的一些特征,是可以计算出来的。
那我们控制什么呢?我们的控制就是,我也构建了一个投资组合,一篮子股票。我这一篮子股票,它在我刚才讲到的这些维度上,尽量要和它保持在一个不能偏差太大的维度,我们认为,当我们把这个维度控制的比较细一点以后,我跟它的偏离是相对可控的,风险也是相对可控的。
除此之外,还要考虑一些其他因素,比如流动性,比如交易成本,比如参与度,以及在交易过程中,规模相对较大以后,还需要避免在交易执行环节触发一些异常交易的情况
作为一个私募产品,会会有合约上一些限制,比如持有的板块集中度等等,它相对比较多样性,各个模块都会涉及到。
我简单讲讲当前聚宽在各个指增线条上的风险控制。基本上聚宽的300、500、1000或者2000,包括全市场指增,它基本上是同一套大模型出来的,它们有共性的部分:
行业偏离度我们都是控制在申万一级的±5%;
风格偏离度我们基本上控制在0.5个标准差以内;
这里面有一个细节,就是我们在市值上的控制,如果按照行业主流的计算方法,以全市场的标准差来算,我们基本上控制在0.2个标准差以内;
还有就是个股集中度的控制,除了300指增以外,其他指数增强产品的个股集中度目前都不高于5‰,300指增会相对高一点,大概在2%以内。
同时还会做一些黑白名单的控制,以上都是风险约束方面的一些要求。
22年之后 持续加强风险认知和刻画能力
JL:其实在2021年那一波回撤之前,大家对于自己的模型或者风险控制的认知还是比较乐观的。经过一波行业回撤之后,我们就在反思,到底哪里出了问题?
首先是预测模型,对股票本身的看法,哪些股票接下来会涨,哪些股票接下来会跌,这方面是否出了问题?第二个,是不是我的风险模型没控住风险?这两个部分我们都会去讨论。
先抛开预测端不讲,只考虑风险端,我们发现整个行业都面临这样的回撤,所以说是一些共性的东西出了问题——回撤大是不是哪块偏差没控住,导致了一些亏损?
我们当时去调风控模型,会发现你把它收得再紧一些,有帮助,但好像没有解决根本的问题。所以说很可能是对于有些风险低估了,或者说没有办法很好的去进行刻画。
在21年那一波行业回撤以后,大家都意识到这个问题,也都尝试过要怎么去控,在历史上能不能把它控住?大家也都开始做一些定制化、个性化的模型,试图更好的去对模型的风控维度进行升级。
23年8月 风控模型加入自研因子并持续迭代
JL:过程中有一个明显的感知,就是去控一些风险以后,我们发现对于收益的影响是非常之大的,同时也没有办法很好的去解决我们历史遇到的问题,一直到23年8月,我们在风险控制环节有一个比较大的突破,有几个新的自研的风格因子加入了聚宽的风控体系。
但是说实话风格因子的开发其实是相对较难的,在这个过程中我们就形成了一套对于风格因子的评价、开发的方法认知,形成以后就开始持续的迭代。
我们对风险控制本身的认知是在持续的迭代的。以前的认知从实践上看,会发现你控住风险以后,收益也在下降,风险和收益就变成一种选择。
现在我们认为风险控制其实某种意义上也是在避免一些拥挤,如果你能比较好的去避免拥挤,理论上讲,它对收益的影响是相对有限的,甚至是没有影响。
所以本质上我们还是围绕这些问题在研究:挣什么钱,风险是什么,风险在怎样变化,在这个过程中不断形成并加入自己新的认知。
量化投资很多时候都是在解决一个既简单又复杂的问题,这个问题理解起来很简单,但实施起来非常复杂,就是如何不断剥离运气,提升能力?
我们希望尽可能多的提升是能力的提升,而不依赖运气,因为能力是一个内在的东西,它在未来会持续下去。
延伸阅读

