——量化投资组合优化的核心逻辑
在量化投资的世界里,组合优化(Portfolio Optimization) 是一个几乎无处不在的基础模块。但很多刚入门的同学会产生一个疑惑:
“组合优化到底是在优化什么?是不是需要把所有股票的收益、风险都预测以后,再挑股票、再定权重?”
其实,大多数组合优化模型解决的是一个更“后端”、更基础的问题:
优化组合是在“知道当前有哪些股票”的前提下,求解这些股票的最优权重。
这句话看似简单,却代表了量化投资中选股(Selection) 与 定权(Allocation) 两个环节的严格分工。下面我们就分步骤拆解,为什么这句话如此重要。
1️⃣ 组合优化的起点:股票池已确定
组合优化的输入数据总是包括:
当前可投资的股票列表(股票池)
这些股票的历史数据或预测数据(收益、波动率、因子暴露、协方差等)
也就是说,优化过程并不负责判断“哪些股票应该被选入组合”。那是 选股模块 的任务。例如:
单因子策略:取因子值排名前30%的股票
多因子评分模型:选择预测上涨概率最高的20只
行业内各选2只股票组成行业均衡选股
选股阶段结束后,组合优化才开始发挥作用。
📌 组合优化不负责选股票,只负责对已选出的股票求最优权重。
2️⃣ 为什么组合优化必须依赖已知的股票集合?
✔ 因为权重本质上是“ how to allocate 比例”,不是“which to choose”
优化的目标通常是:
最小化波动率(Minimum Variance)
最大化夏普比率(Max Sharpe)
控制行业风险(Risk Parity)
市值中性下优化收益(Mean–Variance)
最小化 CVaR 等
无论哪个目标,都需要针对“已有股票”计算其权重矩阵、协方差、暴露矩阵等。
如果股票池都未确定,优化就无从开始。
3️⃣ 组合优化为什么不负责选股?
因为“选股”与“定权”涉及不同的模型、不同的数据要求:
|
|
|
|
|
|---|---|---|---|
| 选股(Selection) |
|
|
|
| 定权(Allocation) |
|
|
|
选股侧重 alpha,
定权侧重 风险结构(risk structure)。
4️⃣ 为什么“知道股票有哪些”是优化能运行的唯一前提?
组合优化的数学形式几乎都要用到协方差矩阵(covariance matrix):
这里的 N 是固定的,即股票池中股票的数量。
如果股票集合改变:
协方差矩阵必须重算
约束矩阵也要重建
风险分解结构也不同
因此:
股票池变化 → 优化问题结构变化 → 模型必须重建
所以优化模型不可能自己决定股票池,必须由上游模块提供。
5️⃣ 一个最经典的例子:最小方差组合
假设你已经选出了 5只股票:
优化问题是:
同时满足:
∑ w i = 1 w i ≥ 0
这里整个优化完全依赖于:
明确知道是这 5 只股票
有这 5 只股票的协方差矩阵
一旦股票换成 10 只,整个优化问题都要重写。
6️⃣ 那么选股和定权如何配合?
一个典型的量化链条如下:
因子/模型输出因子值或上涨概率
选股模块根据因子/评分选出股票池
优化模块根据股票池进行权重优化
执行交易并实时跟踪风险
因此,组合优化永远是链条的第三步。
7️⃣ 实际量化策略中,这句话的意义是什么?
它意味着:
✔ 组合优化不是万能钥匙
它解决的是“如何分配资金”,不是“你该投谁”。
✔ 选股的质量决定了组合优化上限
垃圾股票优化得再漂亮,也很难得到好结果。
✔ 上下游模块要解耦
选股模块可以自由换:因子模型、ML 模型、行业轮动……
但优化模块保持统一:MV、Sharpe、CVaR、风险平价……
🔚 总结:一句话讲透
组合优化一定是在“股票池已经确定”的前提下,对这些股票的权重进行求解。
它不负责挑股票,只负责合理配置资金。
这句话是理解量化投资流程、构建策略模块化体系的关键。
——量化投资中一个常被忽略的关键前提
在量化投资的流程中,组合优化(Portfolio Optimization) 是一个常见却经常被误解的环节。很多初学者常常以为优化模型会“自动挑选出好股票”,甚至认为优化本身既能判断哪些股票值得买,又能确定如何分配资金。
但事实上,几乎所有严谨的组合优化模型,都有一个不可缺少、且非常重要的前提条件:
组合优化是在“知道当前有哪些股票”的前提下,求解这些股票的权重。
这句话揭示了量化投资流程中最关键的拆分:
选择股票(选股) 与 配置权重(定权) 是两个完全不同的问题。
下面,我们重新梳理这一逻辑,并解释为什么这一前提如此重要。
1️⃣ 组合优化不是“挑股票”,是“分配比例”
在所有经典模型中,无论是:
均值-方差模型(Mean–Variance)
最小方差组合(Minimum Variance)
最大化夏普比率(Max Sharpe)
风险平价(Risk Parity)
最小化 CVaR(Minimum CVaR)
它们的目的从来不是挑股票,而是:
在一组固定的股票中,求解一组满足约束的最优权重向量
。 w
换句话说:
优化模型并不知道这些股票是否“好”,
它只关心这些股票如何组合能满足风险收益的要求。
2️⃣ 优化的输入永远依赖“已定的股票集合”
为什么必须先知道股票有哪些?因为所有优化都依赖这些股票的数据结构:
✔ 协方差矩阵必须基于已知股票
例如 5 只股票的协方差矩阵:
它是固定维度的矩阵,只有股票池确定后才能计算。
换成 10 只股票,就必须重算一个新的:
没有股票池,就根本没法定义优化问题。
✔ 约束条件依赖股票集合
例如:
行业暴露约束
杠杆约束
单个权重上下限
风格暴露控制
所有这些都是对“已知的股票列表”定义的约束。
3️⃣ “先选股,再定权”的逻辑来自于模型的分工
量化中的两个大模型模块:
⭐ 模块一:选股(Selection, Alpha Model)
谁更可能涨?
谁的因子得分更高?
谁的预期收益更好?
各种因子模型、机器学习模型都是为“选股”服务的。
⭐ 模块二:定权重(Allocation, Risk Model)
在这些被选出的股票中,如何分配资金?
如何降低波动?
如何减少行业暴露?
如何提高组合整体夏普?
优化模型是为“权重分配”服务的。
这两者并不是同一个任务,因此不应该混为一谈。
4️⃣ 没有股票池,就没有优化问题
为了让你直观理解这个前提,来看一个实际例子。
假设你选出了 5 只股票:
组合优化要做的事情是:
约束:
∑ w i = 1 w i ≥ 0
但是如果股票池改成:
那么:
协方差矩阵完全不同
约束必须重写
风险分解也变化
权重优化要重新做
也就是说:
股票池变化 → 优化问题变化 → 优化模型必须完全重来
这就是为什么组合优化不可能替你“挑股票”。
5️⃣ 组合优化前的那一步,往往才是策略的灵魂
真正能产生 alpha 的一般是“选股模型”:
因子选股(动量、质量、成长等)
机器学习模型(XGBoost、LSTM、GBM)
行业轮动
估值策略
事件驱动
优化模型更多是控制风险、调整结构,保证组合更加稳健。
因此:
选股决定收益的上限,优化决定收益的下限。
选股做得好,优化能让结果更稳定;
选股做得差,优化也无法创造收益。
🔚 总结:组合优化的本质
把一句话讲透:
优化组合不是选股票,而是在选出的股票中决定“买多少”。
这是量化投资中构建完整策略链路的基础认知,也是量化工程体系中最严格的模块化思想。
——量化投资中常被忽视的第一步
在量化投资的体系中,“组合优化”是一个非常核心的概念。无论是构建一个最小方差组合、最大化夏普比率组合,还是风格中性、行业中性下的优化,它们都会最终给出一组权重。
然而,一个经常被忽略、但极其关键的事实是:
组合优化总是在已经“知道有哪些股票”的前提下,求解这些股票的权重。
这句话不仅是模型运行的技术前提,更是整个量化策略结构设计的基础。本文将从三个层面解释为什么这句话如此重要。
1️⃣ 为什么必须先知道“有哪些股票”?
因为组合优化的输入数据结构,都严格依赖这组股票的确定性。
(1)协方差矩阵需要股票集合
假设股票池中有 N 只股票,那么协方差矩阵一定是:
如果没有明确的 N,这个矩阵根本无法定义。
股票池变了,协方差矩阵也必须全部重新计算。
(2)收益、因子暴露、行业暴露都依赖“特定股票”
例如:
每只股票的预期收益向量
μ 行业暴露矩阵
B 风格暴露(size、momentum、value 等)
风险模型结构(如 BARRA 模型)
这些都是严格基于“股票列表”的向量或矩阵。
(3)优化不是“谁更优秀”,而是“如何组合”
组合优化并不会试图判断:
哪只股票未来会涨?
谁的 alpha 更高?
它只关心:
给定这 N 只股票,我如何分配资金才能符合风险收益要求?
因此,股票池必须在优化之前确定。
2️⃣ 为什么选股与定权必须分离?
在量化系统中,有两个完全不同的模型模块:
|
|
|
|
|---|---|---|
| 选股模型(Alpha Model) |
|
|
| 组合优化(Risk Model / Optimizer) |
|
|
这两者既不重复,也不重叠。
✔ 选股决定“谁进来”
这是策略的灵魂,决定 Alpha 来源。
✔ 定权重决定“怎么买”
这是策略的结构,决定风险是否被合理控制。
因此:
先选股,后定权,是量化投资的第一原则。
3️⃣ 一个例子彻底说明问题
假设你有一个简单的因子(如动量因子),从 100 只股票中挑出 10 只作为股票池:
接下来,组合优化才开始工作:
约束条件:
权重之和为 1
权重非负
行业暴露不超过某阈值
如果你把股票池改成:
那么:
要全部换成新集合的收益向量μ 要重建成新股票池的协方差矩阵Σ 行业暴露矩阵也要重新构造
优化问题完全变化。
这就是为什么:
组合优化永远不是在“众多股票中挑选最好的”,而是在“已经选好的股票中找到最好组合”。
4️⃣ 组合优化为何不能替你选股票?
原因很简单:
✔ 组合优化偏向的是“风险结构”(risk structure),不是“收益排名”
举例:
最小方差组合会偏向低波动股票
风险平价会偏向低风险资产
最大夏普比率依赖风险模型结构
这些并不能告诉你“哪些股票未来会涨”。
因此,让优化来选股票几乎等于让“风险模型做收益预测”,这是错误的。
5️⃣ 这句话对实际策略设计意味着什么?
意义非常深刻:
✔(1)你必须先构建“选股逻辑”
无论是因子筛选、机器学习模型、行业轮动还是事件驱动,都必须在优化之前完成。
✔(2)优化模块可以与你的选股模型完全解耦
可以自由替换:
选股可以换(比如改用 XGBoost)
优化可以换(比如从均值–方差换成风险平价)
模块之间独立,让策略系统更加稳健。
✔(3)风险模型永远不创造 alpha
它只是让 alpha 更稳定、更具可控性。
🔚 总结
一句话概括本文的核心观点:
组合优化的本质不是“挑股票”,而是在“股票池已定”的情况下求解最合理的权重。
这是量化投资中结构化思维的关键,理解了这一点,你的策略系统才能真正模块化、可扩展、可迭代。
在量化投资中,组合优化是一个非常重要的环节,无论是最小方差组合、最大夏普组合,还是风险平价组合,本质上都是在一组股票上进行数学优化。
然而,很多初学者容易误解,认为优化本身可以告诉你“买哪些股票”。实际上,优化只能回答一个问题:
在已知股票集合的前提下,如何分配权重最优?
换句话说,组合优化并不会决定股票池,股票池必须先确定。
一、优化组合的核心逻辑
数学上,组合优化通常解决的问题是:
其中:
:组合权重向量w :股票的预期收益μ :股票协方差矩阵Σ
注意:这些参数都是针对已知股票集合的。如果你连股票池都不确定,就无法计算协方差矩阵,也无法求解权重。
二、为什么必须先确定股票池
股票池的确定通常由以下方式完成:
因子筛选:根据动量、估值、成长等因子选出高分股票。
机器学习选股:用模型预测上涨概率或未来收益,从全市场选出 Top N 股票。
基本面或流动性过滤:剔除退市风险、流动性差或财务异常的股票。
指数/行业成分:如沪深300、中证500或新能源板块股票池。
股票池确定后,优化器才能在这些股票上计算风险、预期收益,并求得最优权重。
三、优化组合的意义
一旦股票池明确,优化组合能实现:
风险控制:通过协方差矩阵降低组合波动
收益提升:最大化夏普比率或预期收益
风险分散:行业或单股权重约束,避免集中风险
策略稳健:降低回撤和极端风险
简而言之,优化组合是在给定选股范围下,让投资更合理、更稳健。
四、总结
组合优化不是选股工具,而是权重分配工具。
完整流程是:
确定股票池(通过因子、机器学习或基本面筛选)
计算股票收益和风险
优化权重,构建组合
一句话核心思想:
先知道买哪些股票,才能谈如何分配它们的权重。
这正是量化投资中“选股与配权分工明确”的本质。
在量化投资中,组合优化是投资组合构建的重要工具,无论是最小方差组合、最大夏普组合,还是风险平价组合,本质都是在给定股票集合上分配权重。
但一个常被忽略的事实是:
优化组合的前提,是先知道当前有哪些股票可以投资。
换句话说,组合优化并不会告诉你“买哪些股票”,它只能在已知的股票池中计算最优权重。
一、优化组合的基本逻辑
组合优化本质上是一个数学优化问题,其目标通常包括:
最小化组合波动率
最大化夏普比率
平衡行业或风格暴露
最小化极端风险(CVaR)
优化器的输入是:
股票池(已确定的可投资股票)
预期收益(或收益预测)
股票风险(波动率)及协方差矩阵
约束条件(如权重上限、行业中性等)
输出的结果,是每只股票在组合中应占的比例。
没有股票池,优化器无从计算,也无法给出权重。
二、股票池的确定方式
股票池是组合优化的起点,通常通过以下方式确定:
因子筛选:选取高动量、低估值、成长性优良的股票。
机器学习选股:通过模型预测股票未来收益或上涨概率,选出最有潜力的股票。
基本面或流动性过滤:剔除退市风险、财务异常或流动性不足的股票。
指数或板块成分:如沪深300、中证500或特定行业板块。
股票池确定后,组合优化才能计算权重,合理分配投资资金。
三、优化组合的作用
一旦股票池明确,组合优化可以实现:
科学分配权重:在收益和风险之间寻找最佳平衡
控制风险:通过协方差矩阵降低组合波动
避免集中风险:设置行业或单股权重约束
提升投资效率:最大化风险调整后的收益
简单来说,组合优化是在已知股票池中,让投资更稳健和高效的工具。
四、总结
组合优化不是万能的选股工具,它只是权重分配器。
完整的量化投资流程是:
确定股票池(因子筛选、机器学习或基本面过滤)
计算股票风险和收益指标
优化权重,构建组合
一句话核心思想:
先知道要买哪些股票,才能谈如何分配它们的权重。
这正是量化投资中选股与配权明确分工的本质,也是科学构建投资组合的逻辑起点。
在量化投资中,组合优化是帮助投资者在股票池中分配资金的重要工具。
无论是最小方差组合、最大化夏普比率组合,还是风险平价组合,其核心都是在已知的股票集合中求最优权重。
换句话说,组合优化不是选股,它只负责“买多少”,而不是“买什么”。
一、组合优化的逻辑
组合优化需要以下核心输入:
股票池:当前可投资的股票列表
预期收益:每只股票未来收益的估计
风险信息:每只股票的波动率及股票之间的协方差
约束条件:权重上下限、行业中性、总资金限制等
优化器在这些数据基础上,计算每只股票的权重,使组合在满足约束的情况下实现目标(如风险最小或夏普最大)。
核心观点:
没有已确定的股票池,优化器无法运行,也无法输出权重。
二、为什么必须先确定股票池
股票池决定了组合优化的基础和上限:
因子筛选:动量、估值、成长、质量等因子筛选出高潜力股票
机器学习选股:通过模型预测未来收益或上涨概率,选出优质股票
基本面/流动性过滤:剔除退市风险、流动性差或财务异常的股票
指数/板块成分:如沪深300、中证500或新能源板块股票
总结一句话:股票池决定了组合能投资的范围,优化只是决定“每只股票买多少”。
三、组合优化的作用
当股票池确定后,组合优化可以实现:
风险控制:降低组合波动和下行风险
收益优化:在约束条件下最大化风险调整收益
分散风险:通过权重约束避免行业或单股集中
投资科学化:让每笔资金的配置更合理
换句话说,组合优化是让投资更稳健、更高效的“数学分配器”。
四、总结
组合优化不是万能的选股工具,它只在已知股票池的前提下分配权重。
完整流程可以概括为:
确定股票池(因子、机器学习或指数成分)
计算风险与预期收益
优化权重,形成组合
核心思想:先知道买什么,再决定怎么买。
这是量化投资体系中选股与配权分工明确的本质,也是科学构建组合的基础逻辑。
这个问题很关键,涉及选股阶段和组合优化阶段的边界。我来仔细梳理一下。
1️⃣ 你提到的操作是什么
使用 KL 散度追踪误差:通常是在做指数增强(Enhanced Indexing)策略时,为了让组合与基准指数的偏离最小化,即在选定股票后控制组合整体偏离基准指数的行业和市值结构。
控制行业/市值权重,贴近指数权重:也是为了让最终组合的行业、市值暴露尽量接近指数,而不是简单按照某个信号选股。
2️⃣ 这些属于哪个阶段?
核心判断标准:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
你提到的 KL 散度追踪、行业/市值贴近指数,其作用是对权重进行调整,使组合结构贴近基准或约束条件。
✅ 所以,这属于组合优化阶段,而不是选股阶段。
在选股阶段,你可能会基于因子打分或机器学习模型挑出 Top N 股票进入池,但不会去考虑它们的行业、市值和指数贴合度。
在组合优化阶段,你才会用 优化器(如最小跟踪误差、最大夏普、CVaR) 来计算每只股票的权重,并加入行业、市值约束,使组合既持有优质股票,又控制风险、贴近指数。
3️⃣ 直观理解
选股阶段:挑出 50 只你认为最有潜力的股票。
优化阶段:在这 50 只股票里计算权重,加入约束:
行业权重不偏离指数超过 ±5%
市值分布与指数贴近
最小化组合波动率或跟踪误差
最终输出的就是一个符合约束、贴近指数的组合权重。
✅ 总结
KL 散度追踪误差、控制行业/市值权重、贴近指数权重,都属于组合优化阶段的操作,而不是选股阶段。
选股决定股票池,优化决定在股票池中如何分配权重,同时满足约束和目标。
——————概率游戏 ——————
概率资本:概率资本涉足全球化投资组合,包括多市场、多渠道、多产品。具体表现为股票(A股、港股、美股及其他国家二级市场)、期货、外汇、及一级股权投资市场。
顺势概率:趋势不会轻易形成,也不会轻易结束,一两个涨停跌停不足以改变趋势。顺势而为,概率优势是交易的理念。耐心等待属于自己的交易机会,赚自己看得懂的钱。
发布频率:一般情况下,每两周筛选一次(周二左右),特殊情况下会有所调整;心态及文章分享会不定时发送。
入场时机:交易机会不是做出来的,是等出来的。每次发布的入场时机基于第一入场时机原则,如果错过第一入场时机,就耐心等待下一个机会;下一次发布的时候如果入场机会还在,会继续入选,但如果有一段涨幅,可能就不再入选,但并不代表该标的没有继续上涨的机会,只是错过第一入场时机,激进的朋友可以追进去。这市场不缺机会,缺的是等待机会的耐心。
投资组合:每次发布交易机会列表会把符合交易机会的交易标的全部筛选出来,对数量没有强制要求。没有强制规定一次只能选20个、30个或者50个,如果一个都不符合,可能一个也不发布,如果都符合,可能都会发布,和数量无关,只和是否符合交易原则有关。
等待原则:弱水三千,只取一瓢饮。提高赢面,学会等待,放弃一切似是而非的机会;放弃、放弃、还是放弃, 放弃看不懂的复杂趋势;等待、等待、还是等待,等待能看懂的简单趋势。静静地等待,等待完全符合规则的机会出现,等待概率优势的机会出现,等待属于自己的机会。在等待概率优势机会的过程中,必须经得起各种诱惑,不要妄想抓住所有机会,只赚属于自己的钱,只交易属于自己的交易机会。
统计世界:万物有周期、世事有轮回。周期、轮回、钟摆。万事万物皆可统计,统计,世界,统计世界;世界,统计,世界统计;大盘统计,统计大盘;大盘追踪,追踪大盘。多市场、多品种、多产品、多周期、多技术、多角度、多维度、多层次、多种类、多世界、多技术指标、多统计、多追踪。多维度多角度进行统计、个体、全体、局部、全局、一个维度、两个维度、多个维度、不同角度。1个统计不够,来两个,两个统计不够来一百个,一百个不够来一万个。多高度、多角度、多维度统计。大盘统计、大盘追踪,这世界没什么不能统计的。万物相通,周期轮回,在统计的过程中,你会有意无意发现这世界的奥妙规律。
利弗莫尔:如果这一辈子我在投资交易中没有成功,并不是我没有这个能力,而是我自己不想成功。因为我已经知道了在市场中赢钱的办法:只要我有足够的耐心等待,只在市场的走势符合我的经验和理论,只在我有把握的范围内才行动,我就能赚到钱。而且,那样的机会早晚会出现的。如果我的投机事业最终失败了,肯定是因为我违背了自己的交易方法和经验教训,做了大量我自己也认为是错误的交易。例如,被市场走势诱惑追涨杀跌,无法控制自己贪婪的交易欲望,逆势交易,等等。
合作机会:资方、机构合作,可以直接留言。
欢迎关注微信公众号,后台回复【真实姓名-机构-职位-联系方式】加入概率资本交易圈。


