在量化投资中,组合优化是最具数学味、同时也是最容易被误解的部分。许多初学者常会问:
“优化组合是不是就直接用当前这些股票做优化?”
“优化是否一定需要历史收益或风险?”
答案很明确:
在知道“当前有哪些股票”的前提下,只有一种方法不需要历史数据:等权。
其他所有优化方法,都必须基于历史收益或历史风险信息,才能得到权重。
这句话看似简单,却抓住了组合优化最核心的结构:
优化是基于历史表现对未来的预测,而不仅是对当前股票清单的加工。
1. 组合优化必须以“已知股票池”为前提
组合优化不是选股,而是 在已选定的股票集合内部,求解最佳权重分配。
这一点非常关键:
选股 = 先确定哪些股票进入组合(universe)
优化 = 决定这些股票各占多少权重(weights)
优化不负责回答“要不要买这只股票”,它只负责回答“买多少”。
因此所有优化方法的第一步都是:
先知道当前有哪些股票。
没有股票池,就无法构建收益矩阵、风险矩阵,也就无法进入优化。
2. 唯一不需要历史数据的方法:等权
等权(Equal Weight)非常特别,它是唯一一个完全不依赖历史信息的方法。
你只需要知道:
股票池里有多少只股票
不需要知道:
它们历史收益
它们历史风险
它们历史波动率
它们历史表现是否稳定
因此等权其实不是“优化”,而是一种人为规则。
它不做预测,也不做估计,只是“平均分配”。
3. 为什么其他所有方法都必须用历史数据?
因为这些方法都试图优化某种“未来预期表现”,而预期必须来自历史。
(1)需要历史风险的方法
如:
最小方差(Min-Var)
风险平价(Risk Parity)
最小 CVaR
下行风险最小化
波动率最小化
这些方法要计算:
或:
这些都是基于历史收益序列计算出来的。
没有历史风险数据,就无法建立任何风险模型,自然无法优化。
(2)需要历史收益的方法
如:
收益最大化(Max Return)
最大化夏普比率(Sharpe)
最大化索提诺比率(Sortino)
效用最大化(Utility Maximization)
这些目标需要:
即资产的历史平均收益。
如果不知道历史收益,就无法构建收益向量。
(3)同时需要收益+风险的方法
这是最常见的类别:
均值—方差(Mean-Variance)
最大化夏普比率
最大化效用函数
这些方法使用如下目标:
必须同时知道 μ(历史收益)和 Σ(历史风险)。
换句话说:
如果你不知道股票过去是怎么涨跌的,你就无法评估未来该给它多少权重。
4. 为什么“历史信息”如此重要?
优化的本质是:
用历史数据为未来做最优预测。
例如:
高波动股票 → 风险太大 → 权重应降低
低波动股票 → 风险可控 → 权重提高
稳健走高的股票 → 未来期望收益较高 → 权重提高
急涨急跌的股票 → 期望收益不确定 → 权重降低
这些判断都离不开对“过去表现”的理解。
如果不看历史,你就根本无法对未来做建模。
5. 为什么等权不需要历史数据?
因为它不假装自己知道未来。
不预测
不推断
不优化
不建模
它的内核只是:“我不知道谁好谁坏,那就都分一样吧。”
因此等权属于:
非预测方法
非数据方法
非优化方法
在机构内部,等权常常作为:
benchmark(基准)
naive strategy(朴素策略)
zero-information model(零信息模型)
它是一切优化方法的“参照系”。
6. 最终总结(告诉你如何一眼判断)
判断某种组合方法是否需要历史数据,只需问一个问题:
它是否试图优化收益或风险?
如果需要 → 必然需要历史数据
如果不需要 → 那就是等权
因此结论只有一个:
⭐ 结论
除了等权,其他所有组合优化方法都需要知道个股过去的历史数据(收益或风险),才能进行组合优化求解权重。
换句话说:
等权 = 只需要知道“当前有哪些股票”
其他方法 = 必须知道“当前股票 + 它们过去表现”
这是组合优化领域最基本的一条结构性规律。
在量化投资中,“组合优化”常被视为智能决策的核心:通过数学模型,在已选定的股票集合中找到最优的权重分配。但许多人在学习组合优化时会遇到一个重要疑问:
优化权重时,到底需不需要知道这些股票过去的表现?
答案看似简单,却直接触及组合优化的本质:
除了等权之外,所有组合优化方法都必须依赖个股过去的历史数据(收益或风险),否则根本无法求解权重。
要理解这句话,我们需要从组合优化的“逻辑基础”说起。
1. 组合优化为何必须先知道股票有哪些?
组合优化从来不是做“选股”。
它做的是:给已经选好的股票分配权重。
优化的数学对象是一个向量:
其中 N 是股票数量。
如果股票集合都没有确定,那么:
不知道 N 是多少
不知道任何股票的历史收益
也无法计算协方差矩阵 Σ
目标函数都写不出来
因此,优化永远是在“股票池固定”之后进行的。
这一步是前提,不是可选项。
2. 等权为何是唯一不需要历史信息的例外?
等权(Equal Weight)是一种极度朴素的分配方式:
它完全不关心:
股票过去涨过还是跌过
波动大还是小
风险结构稳定与否
历史收益是否具有持续性
等权的哲学是:
“我不知道,也不尝试判断谁更好,那就全部平分。”
这种方法没有预测成分,更没有任何优化成分,甚至称不上“模型”。
因此它自然不需要历史数据。
也正因为它不依赖历史数据,所以等权往往被称为:
零信息组合(zero-information portfolio)
朴素策略(naive strategy)
基准组合(benchmark portfolio)
它是所有权重方法的起点,也是最低信息假设的代表。
3. 为什么其他所有方法都必须依赖历史数据?
原因非常简单:
因为它们都在试图预测未来,而预测必须基于历史。
我们逐类来看。
(1)优化“风险”的方法 → 必须依赖历史风险
如:
最小方差
风险平价
方差约束优化
最小化 CVaR
这些方法都需要历史收益序列来计算:
个股波动率
协方差矩阵 Σ
下行风险指标
尾部损失分布
例如最小方差组合的目标函数:
如果没有历史数据,就无法得到 Σ,整个目标函数都不存在。
(2)优化“收益”的方法 → 必须依赖历史收益
如:
最大化收益率(Max Return)
最大化预期收益的效用方法
目标函数需要历史均值 μ:
没有历史收益,就无法构建 μ。
(3)同时涉及收益与风险的方法 → 更加依赖历史信息
如:
均值—方差(Markowitz)
最大化夏普比率
最大化 Sortino 比率
最大化效用函数(收益 - 风险厌恶 × 风险)
其目标函数格式如:
需要 μ,也需要 Σ。
换句话说:
如果没有历史数据,就没有收益向量、没有风险矩阵,也就没有夏普、更没有任何优化可言。
4. 优化为何不能仅用“当前价格”?
一些同学常会问:
“优化时知道当前哪些股票,不就够了吗?还要历史数据做什么?”
这是一个误解。
组合优化试图回答的问题不是:
“现在这些股票是多少价格?”
而是:
“未来这些股票的表现怎样?”
“应该给谁更高的权重?”
“风险应该如何分配?”
“收益与风险的结构如何优化?”
而“未来表现”只能从“历史表现”中推断:
历史 → 统计估计 → 风险模型/收益模型 → 优化权重
不使用历史数据,就无法完成以上任何步骤。
5. 一个最简单、最清晰的结论
可以用一句话把所有组合优化方法分成两类:
不需要历史数据的:只有等权。
需要历史数据的:其他所有权重优化方法。
因为优化要求对未来进行预测,而预测离不开历史。
6. 最终总结
在组合优化中:
必须先知道当前股票池。
只有等权只依赖股票数量,不依赖历史数据。
其他所有方法(风险类、收益类、夏普类、CVaR、效用)都必须依赖历史数据。
不依赖历史数据,就无法构建目标函数,也无法优化。
因此结论清晰无比:
除了等权,其他所有组合优化方法都需要知道个股过去的历史数据(收益或风险),才能进行组合优化求解权重。
这不仅是事实,也是组合优化的理论基础。
在组合管理中,人们常常问:
“我现在手上有十只股票,我要如何分配权重?”
这句话背后,其实隐藏着一个关键前提 —— 你已经知道了当前有哪些股票。
然而,真正决定你如何分配权重的,不是这些股票本身,而是:
它们过去是怎么表现的。
于是,一个根本性的事实浮现:
一、如果你不看历史,那只有一条路:等权
等权配置(Equal Weight)就像对十位陌生人说:“你们我都不认识,所以我给你们每人一杯茶,平等对待。”
等权唯一需要的信息只有:
股票有哪些
数量多少
它完全不需要问:
过去谁涨得多?
谁波动大?
谁风险暴露高?
谁经常暴雷?
你不需要知道,也不关心。
换句话说:
等权是唯一一个不依赖任何历史信息的组合方法。
二、但当你想“优化”,你必须回头看
真正的组合优化,无一例外,都反映一个共同点:
你必须知道这些股票的历史“性格”。
就像你要组建一个团队,不了解每个人过去的表现,你无法决定让谁负责什么。
投资中的“性格”包括:
历史平均收益
波动率
协方差(与其他股票一起波动的方式)
尾部风险
下行风险
历史最大回撤
对市场因子的敏感度
这些信息告诉你:
哪些股票稳定
哪些股票容易大涨或大跌
哪些股票互相对冲
哪些股票“同喜同悲”
整体组合的风险如何分布
没有这些,你无法谈风险,也无法谈收益。
三、为什么所有优化方法都离不开历史?
让我们逐一拆解。
1. 最小化风险(最小方差)
需要知道:历史风险(方差)、相关性、协方差矩阵
—— 否则你如何判断风险?
2. 最大化收益 / 最大化夏普
需要:历史收益均值 + 风险指标
—— 没有过去,你就无法估计未来概率分布。
3. 风险平价(Risk Parity)
需要:历史波动率、相关性
—— 否则你无法知道“谁风险大谁风险小”。
4. CVaR 优化
需要:历史损失分布
—— 这是对尾部风险的研究,必须用过去的极端情况。
5. 效用函数
需要:历史收益 + 历史风险
—— 否则效用无法量化。
你会发现:
所有优化方法的核心是 —— 用历史来推测未来。
如果没有历史,就没有概率分布;
没有概率分布,就没有优化问题。
四、为什么“等权”是例外?
因为等权没有“预测能力”。
它不试图预测未来,也不试图优化过去。
它只做一件非常朴素的事:
在不知道谁好谁坏的情况下,把包裹平均分给每个人。
这也是它经常能战胜许多华丽模型的原因:
简单
稳健
不依赖噪声数据
不会因为估计误差而失效
等权看似平凡,却在许多场景下出奇有效。
五、结语:组合优化是一门历史学
组合优化看似是为了未来计算权重,但过程却完全依赖过去。
从某种意义上说:
组合优化就是用历史数据为“未来结果”分配概率,然后基于概率分布求解最优权重。
因此:
你必须知道有哪些股票(这是计算的输入)
等权可以不知道过去(因为它不做预测)
其它所有优化方法必须知道过去(因为它们在做概率推断)
这就是组合优化最本质的逻辑。
在投资组合构建中,我们常常追求“更科学的配置方式”,如最小方差、最大化夏普比率、风险平价、最小化 CVaR 等。
然而,这些方法看似复杂,却都共享一个最基础的原则:
除了等权之外,所有组合优化方法都必须依赖个股过去的历史数据——股价走势、收益表现、风险暴露。没有历史数据就无法优化权重。
说得直白一点:
你可以在不知道过去的情况下平均分配权重(等权)
但你无法在不知道过去的情况下“优化”权重
这就是组合优化的本质逻辑。
一、等权:唯一不依赖历史的选择
等权配置(Equal Weight)非常朴素:
不需要知道股票涨过还是跌过
不需要知道谁风险大谁风险小
甚至不需要知道协方差是什么
你只需要知道:
“我现在有 N 只股票。”
权重就自然是:
等权不预测未来,也不评估风险,更不试图发现关系。
它只是一个:
不做判断
不依赖数据
不构建模型
的最简单分配方式。
因此,它是唯一不依赖历史的组合方法。
二、但你一旦开始“优化”,历史数据就不可或缺
组合优化意味着什么?
意味着:
你要根据股票过去的表现,推断它未来可能的表现,然后根据“未来表现的概率分布”求解最优权重。
这句话拆开来看:
历史收益 → 用来估计未来收益
历史波动率 → 用来估计未来风险
历史协方差 → 用来估计股票之间如何一起波动
历史极端行情 → 用来估计尾部风险(如 CVaR)
没有过去,就推不出未来;
推不出未来,就无法优化。
这就是为什么:
最小方差需要历史协方差矩阵
最大化夏普需要历史收益和风险
风险平价需要历史波动率
CVaR 需要历史损失分布
这些算法本质上都是概率优化,而概率必须从历史中来。
三、各类优化方法为何必须依赖历史?
为了更清楚,我们用“如果没有历史,你就做不了什么”来说明。
1. 最小化风险(最小方差)
你必须知道:
每只股票过去波动有多大
它们之间如何联动(协方差)
否则:
你无法计算组合风险,也就无从“最小化”。
2. 收益最大化 / 最大化夏普比率
你必须知道:
谁过去收益高
谁过去风险低
它们是否互相对冲
否则:
你无法估计预期收益,也无法构建夏普比率。
3. 风险平价(Risk Parity)
你必须知道:
每只资产的历史波动率(风险贡献)
否则:
你无法决定让谁承担多少风险。
4. 最小化 CVaR
你必须知道:
每只股票过去的尾部亏损长什么样
否则:
你无法衡量“最坏 5% 的情况会多惨”。
5. 最大化效用函数
你必须知道:
过去的收益(期望)
过去的风险(方差)
否则:
效用函数根本没法计算。
四、组合优化其实是“历史推断未来”的游戏
你可能以为组合优化在求“未来最优的组合”。
但在数学上,它做的是:
根据过去估计未来的分布,然后在这个分布上做优化。
换句话说:
没有过去
就没有分布
没有分布
就没有优化问题
历史就是组合优化的起点和基础。
五、总结:历史是优化的燃料
如果用一句话总结:
等权是唯一不看历史的组合方法;
其他所有优化方法,都依赖个股过去的历史数据才能求解权重。
因为:
风险要从历史里估计
收益要从历史里估计
协方差要从历史里估计
尾部风险要从历史里估计
效用函数的输入也来自历史
组合优化不是神秘的数学游戏,它只是:
用过去理解未来,用未来的概率分布求得最优的权重。
在投资实践中,构建一个投资组合并不难:
只要你知道今天可以投资哪些股票,随便给一组权重,组合就成立了。
真正困难的是:
如何给出“更优”、更稳健、更具风险调整后收益的权重?
这时,一个常被忽视的真相浮出水面:
除了等权配置之外,所有组合优化方法都必须依赖个股过去的历史数据——历史股价、收益或风险特征。没有历史,就无法求得优化权重。
这一点既简单又深刻,它构成了整个现代组合理论(MPT)的基础。
一、等权:唯一不依赖历史的配置方式
等权配置(Equal Weight)可以看作投资界的默认选项。
它不做预测,也不做判断,只遵循一个原则:
“每个资产占相同的权重。”
它不问:
谁过去赚得多?
谁波动大?
谁动不动就暴涨暴跌?
谁对大盘敏感?
在等权的世界里,每只股票都是“第一次见面”的陌生人。
你只需要知道:
有多少股票
股票名字是什么(甚至名字都不重要,只要数量够)
就可以分配权重。
换句话说:
等权不需要历史,因为它不试图聪明。
二、但只要你想“优化”,历史数据就是唯一入口
什么叫“优化”?
优化意味着要 预测未来 ——即使这种预测是基于统计意义的。
而未来的预测必须从哪里来?
答案只有一个:过去的历史数据。
因为:
风险来自历史波动
收益来自历史趋势
协方差来自历史的共同涨跌
极端风险来自历史的尾部行情
因此:
所有非等权优化方法,都需要历史数据来构建概率分布,再根据这个概率分布求得最优权重。
你不可能在不知道过去的情况下判断:
谁更稳健
谁风险更大
谁能对冲谁
谁应当被增配
谁应该减少权重
优化 = 判断
判断 = 基于历史
这是不可推翻的逻辑。
三、各类优化方法为何必须依赖历史?
下面我们以“如果没有历史,就做不了什么”的角度解释。
1. 最小化风险(最小方差)
需要:
历史波动率
协方差矩阵
否则你连“风险矩阵”都构建不出来,更不可能谈最小化。
2. 最大化收益 / 最大化夏普比率
需要:
历史平均收益
历史波动率
历史协方差
否则:
夏普比率是未来期望收益 / 风险
但两者都必须由历史估计。
3. 风险平价(Risk Parity)
需要:
历史波动率
历史协方差
否则你不知道谁风险大,如何让大家“风险贡献相等”?
4. CVaR 优化(最小化尾部风险)
需要:
历史损失分布
历史极端行情的数据
否则你无法估计“最差 5% 的情况会发生什么”。
5. 最大化效用函数
需要:
历史收益
历史风险
否则效用无法计算。
换句话说:
只要你的优化目标包含“收益、风险、相关性、尾部风险”等字眼,就一定需要历史数据。
四、未来在数学上只能“由历史来推测”
组合优化表面上是在求“未来的最优组合”,
但数学上做的事情其实是:
1. 用历史得到分布估计(收益均值、协方差、尾部概率)
2. 用这个分布求未来最优权重
如果没有第一步,就无法进行第二步。
这就是为什么:
等权不用估计未来 → 不需要过去
优化要估计未来 → 必须依赖过去
历史就是组合优化的“燃料”。
五、总结:组合优化的世界里,过去决定未来
如果把组合优化比作导航,那么:
等权像是“你站在原地随便选一条能走的路”
其他所有优化方法像是“要计算最短路径、最安全路线、最少拥堵路线”
而后者都必须依赖“历史交通数据”。
因此,核心结论是:
除了等权之外,所有组合优化方法都必须依赖个股过去的历史数据(股价、收益、波动、风险),才能求解有效的组合权重。
因为优化不是凭空发生的,它是建立在历史概率分布上的未来判断。
这不是选择,而是数学必然。
在组合管理的世界中,人们常常讨论“最优权重”。
但你会发现一个看似简单、实则深刻的现象:
如果你不看过去的历史数据,唯一能给出的权重,只剩下等权。
任何试图“优化”的方法,都必须依赖个股过去的历史股价、收益或风险数据。
这一点如此基础,却往往被忽略。
一、等权是没有记忆的分配方式
等权配置(Equal Weight)是所有组合方法中最简单的形态。
它不需要任何历史数据,仅仅会问两个问题:
今天有哪些股票?
一共有多少只?
然后直接给出权重:
它不去评估:
谁过去挣得多
谁过去风险大
谁之间相关性强
谁过去暴跌过
等权不需要记忆,也不做判断。
它像是一个完全“没有历史意识”的分配方式,只在当下平分一切。
二、但任何“想要更好”的方法,都离不开历史
当你开始思考:
我希望风险更小
我希望收益更高
我希望回撤更轻
我希望上下行比率更好
我希望资产之间能对冲
我希望尾部风险更小
这些需求本质上都指向一个事实:
你必须研究股票过去的行为模式,才能对未来做出预测。
这就是非等权法与等权唯一也是根本的区别:
等权:不关心历史
优化方法:完全建立在历史之上
三、各类优化方法为什么必须依赖历史?
我们不从数学公式讲,而从简单逻辑讲:
1. 最小方差(最小化风险)
你想让风险最小,但你连“过去谁风险大、谁风险小”都不知道,
那你要如何判断谁应当减少权重?
没有历史波动率,没有历史协方差矩阵,这个模型毫无意义。
2. 最大化收益
你想让收益更高,但你不知道过去谁赚钱能力更强。
你无法甚至定义“预期收益”,更不可能最大化它。
3. 最大化夏普比率
夏普比率需要:
预期收益(来自历史)
预期风险(来自历史)
如果没有历史,这个比率根本无法计算。
4. 风险平价(Risk Parity)
风险平价强调:
让所有资产贡献相同风险
但你不知道:
谁风险大
谁风险小
那又从何实现平价?
5. CVaR 优化(尾部风险最小化)
你不知道过去的极端损失长什么样,
就无法估计最差 5% 的发生情况。
没有历史尾部数据,也就不存在尾部风险模型。
6. 效用函数优化
效用函数的输入是:
历史收益
历史风险
没有这些数值,效用函数等于空壳。
四、组合优化就是“用过去推测未来”的过程
虽然所有模型都说“我们在优化未来”,
但数学真相是:
我们只能用过去的数据,来构建未来的概率分布,再在这个分布上进行优化。
换句话说:
历史构建分布
分布定义未来
未来决定权重
没有历史,就没有分布
没有分布,就没有优化
这不是理论偏好,而是数学的必然。
五、结语:无历史,不优化
如果你必须用一句话理解整个组合优化体系,那便是:
等权之外的所有方法,都需要依赖个股过去的历史股价、收益或风险数据,才能求得优化权重。因为优化的过程,本质上是基于历史的未来决策。
所有看似复杂的优化模型,都不过是在不同方式地问同一个问题:
“过去告诉我们未来大概率会怎样,我们应该如何配置权重?”
而这个问题的答案永远离不开历史。
在组合优化里,只要有历史股价,其余所有需要的历史信息(收益、波动率、协方差、风险暴露、尾部风险)都可以从股价推导出来。
因此:
你不需要单独准备“历史收益”
你不需要单独准备“历史风险”
你不需要单独准备“协方差”
你不需要单独准备“回撤、波动、CVaR 等风险指标”
只需要历史股价就够了。
✔ 为什么“历史股价”是唯一必要的原始数据?
因为所有组合优化模型的输入都来自于股价:
1. 收益(Returns)从股价计算:
或 log return:
2. 风险(波动率)从收益计算:
3. 协方差矩阵(Covariance Matrix)从收益计算:
MVO、最小方差组合、夏普优化等最核心的输入就是协方差矩阵,而它完全来自于收益,收益又来自股价。
4. CVaR、VaR 等尾部风险,从收益序列计算:
比如 5% CVaR:
仍然只需要收益 → 仍然只需要股价。
5. 风险平价需要波动率和协方差,也都来自收益
而
6. 效用函数需要预期收益与方差
都是收益 → 来自价格。
✔ 结论(非常重要)
组合优化唯一真正需要的原始数据是:历史股价。
其它信息:
历史收益
历史风险
协方差
尾部风险
历史波动率
历史最大回撤
历史相关系数
全部都可以从历史股价推导出来。
因此你的总结 完全正确:
👉 只要有历史股价,就可以进行任何类型的组合优化。
👉 等权之外的所有方法,都必须从股价里“挖出”收益和风险指标来优化权重。
——为什么除了等权以外的所有组合优化,都必须依赖历史数据?
在投资组合构建中,经常会看到各种“高大上”的组合优化方法:
最小方差组合(Minimum Variance Portfolio)
均值-方差组合(Mean-Variance Portfolio)
最大夏普比率组合(Max Sharpe Ratio)
风险平价(Risk Parity)
最大化收益组合、最小波动组合、CVaR 最优组合、最大多样化组合……
这些方法外表不同,但本质来自同一个核心原则:
除了等权组合之外,所有组合优化都必须依赖个股的历史数据。
更进一步——
只要拥有“历史股价”这一项数据,就能计算出所有优化模型所需的输入,从而进行任何类型的组合优化。
下面我们分步骤拆解为什么这是必然结论。
1. 等权组合:唯一一个不需要任何历史数据的策略
等权组合(Equal Weight Portfolio)是最简单也最鲁棒的投资策略。
它不看个股的任何历史表现,也不考虑风险、相关性或预期收益。
你只需要知道股票池有哪些股票,权重自动就是:
不依赖历史 → 不存在过拟合 → 在噪声高的市场中反而常常胜过复杂模型。
但除了等权之外,所有优化策略都需要历史分布特征作为输入。
2. 所有优化方法,都离不开“历史统计量”
无论你的优化目标是什么,本质都是在求解:
这些变量全部来自历史数据,例如:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
所以,只要你用到“优化”,就一定要使用这些历史统计量,而这些统计量全部可以用历史股价计算得到。
3. 为什么说“只需要历史股价就够了”?
因为所有你需要的特征,都可以从历史股价衍生出来:
4. “输入最简化”原则:历史股价是唯一最底层数据
所有高维信息都来自价格:
历史股价
↓
收益序列
↓
均值、波动率、协方差、相关性
↓
风险度量、收益预测、因子暴露
↓
组合优化(Sharpe、MV、RP、CVaR…)
也就是说你的组合优化模型,无论多复杂,实际上构建在这一条数据链上。
底层只有一类数据:价格。
5. 所以我们可以总结为一句话
除了等权以外,所有组合优化都必须依赖历史统计量,而这些统计量都可以由历史价格唯一推导出来。只要有历史股价,就能进行任何类型的组合优化。
这就是组合优化的底层逻辑。
——为什么所有优化方法都绕不开历史数据?
在资产配置和量化投资中,我们经常听到一句话:
除了等权之外,任何组合优化方法都必须依赖历史数据。
并且进一步延伸得到一个更本质的观点:
只要你有了历史股价,其余所有优化所需的数据、统计量、因子和风险模型都可以从价格唯一推导出来。
这是一条贯穿所有组合构建方法的底层逻辑。
无论策略如何变化,无论框架如何升级,你最终都一定会回到“历史价格”这一最底层的数据源。
本文将从三个角度证明这件事:
(1)为什么等权不需要历史数据?
(2)为什么所有其他优化方法都需要历史数据?
(3)为什么历史价格是唯一且足够的输入?
1. 等权组合:唯一不依赖历史的权重模型
等权(Equal Weight)是一类非常特别的组合:
不看收益
不看风险
不看相关性
不看波动率
不看分布特征
你只需要知道股票池里有哪些股票,权重马上就能算出来:
这也是等权组合在实际中表现常常不差的一个原因——
它没有任何“预测”,就没有任何“预测误差”。
但也正因为它不使用历史数据,它不能适应个股风险差异、不能处理行业集中度、无法做暴露控制,也无法在特定场景下提升组合的风险调整后收益。
2. 其他所有优化方法,本质上在做“历史统计量”的数学运算
所有优化方法,看似各不相同,但核心都在求解同一类数学问题:
而这些变量全部都来自历史分布:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
换句话说:
只要你用到了“风险”、“收益”或“相关性”三个字,你一定在使用历史数据。
3. 为什么只需要历史股价就能得到所有优化输入?
因为历史股价是唯一的“原料数据”,其余统计量全部是“衍生品”。
下面是整个推导链路:
到此为止,可以得出一个结论:
任何组合优化所需的变量,都能够、也只能由价格数据计算得到。
而且只需要历史价格这一个数据输入。
4. 历史股价:组合优化的最低可行输入
组合优化需要处理三件事:
收益的高低(由平均收益计算)
风险的大小(由波动率和协方差计算)
资产之间的关系(由相关性计算)
这三项都来自历史价格。
因此价格是支撑整个优化体系的“最低可行输入(MVI)”。
理解了这一点,你会发现:
即使你没有财报数据
没有行业分类
没有因子模型
没有宏观环境
没有新闻文本
只要你有历史股价,就能做:
最小方差
最大夏普
风险平价
CVaR 最优
均值-方差
稳健优化
风格中性优化(基于价格因子)
Beta 控制
最大分散化
多目标优化
价格就是整个优化模型的“第一性原理数据”。
5. 最终的核心原则
将上述内容压缩成一句最本质的话:
除了等权,任何组合优化都必须依赖历史统计量,而这些统计量全部可以(并且必须)由历史股价推导出来。因此,只要有历史股价,就可以进行任何类型的组合优化。
这句话就是组合优化的底层逻辑,也是所有投资组合理论的共同根源。
在组合优化的世界里,有一个简单却决定性的事实:
除了等权之外,所有组合优化方法都必须依赖历史数据,而最核心的历史数据就是:历史股价。
这句话几乎决定了任何投资组合的构建方式、优化逻辑以及性能边界。理解这一点,可以让我们真正看懂多资产配置、因子组合、风险控制模型的底层结构。
一、等权:唯一不需要历史数据的组合方法
等权(Equal Weight)之所以特殊,是因为它只做了一件事:
平均分配权重:每个资产都给同样的比例。
计算方式非常直接:
为了得到这个结果,你只需要知道两件事:
当前有哪些股票
股票数量是多少
完全不需要哪怕一天的历史股价,也不需要收益、风险或相关性。
这也是等权被称为“最朴素的组合”的原因。
二、为什么其他所有优化方法都必须依赖历史?
因为所有优化方法,本质上都在最大化某种“好处”或最小化某种“坏处”:
收益
风险
相关性
波动率
下行概率
CVaR
Sharpe
因子暴露
多目标效用函数
而这些量,没有任何一个能够直接从“当前价格”得到,它们都依赖一个东西:
历史价格序列。
原因很简单:
你要知道收益,你要回看价格;
你要知道风险,你要看收益的波动;
你要知道相关性,你要观察资产共同涨跌的历史;
你要知道尾部风险,你要看过去的极端情况;
你要做均值-方差,你必须有 μ 和 Σ;
你要做风险平价,你必须有波动率 σ。
它们的共同输入,只有一个:价格历史。
三、历史股价是所有优化指标的源头
只要你有历史股价,你就能够“推导出”所有优化模型需要的数据:
因此:
只要有历史价格,就可以计算收益、风险、相关性、尾部风险和所有因子数据,因此可以做任何组合优化。
四、核心总结:为什么历史股价是“唯一必要输入”?
因为组合优化通过数学模型进行权重求解,而这些数学模型都依赖统计量,而统计量都依赖序列数据,而序列数据来自历史价格。
逻辑链条如下:
历史价格 → 收益序列 → 风险/相关性/分布 → 优化目标 → 最优权重
没有历史价格,这条链路就无法启动。
五、一句话结论
等权是唯一不需要历史股价的组合方法。
所有其他组合优化模型——无论是最小方差、最大夏普、CVaR,还是风险平价或效用最大化——都必须基于历史数据,且这些数据最终都可以从历史股价推导而来。
这就是组合优化的底层逻辑,也是任何投资者必须理解的基础。
结论:指数增强中使用 KL 散度进行市值约束、行业约束(或使用纯约束方法)本身 不需要历史数据。
但它们通常与优化目标绑定,而优化目标是否需要历史数据,则取决于你选了哪种目标。
下面详细讲清楚两个层面。
✔️ 一、KL 散度用于市值约束 / 行业约束 ——不需要历史数据
KL 散度约束的形式一般是:
用于:
市值约束 → 权重靠近指数
行业约束 → 行业暴露靠近指数
风格约束 → 风格因子靠近指数
单股票约束 → 控制偏离度
这些 都只使用“当前指数的市值权重 / 行业权重”,和“当前你选出的股票池”。
也就是说:
→ KL 散度约束本身只需要当前的权重,不需要区间历史数据
只要你知道指数 today 的行业权重、市值权重,你就能算 KL。
✔️ 二、但组合优化的“目标函数”通常需要历史数据
虽然约束不需要历史数据,但 你优化的目标函数是不是需要历史数据?
需要分情况讨论。
需要历史数据的优化目标
这些都是基于收益波动或风险统计量:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
这些目标在指数增强中很常见,因此通常需要历史数据。
不需要历史数据的目标(较少见)
如果目标是:
❌ 纯偏离最小化(无风险统计量)
例如:
或者直接:
最小化偏离度
直接贴近指数权重
控制 KL 但不优化风险统计量
理论上不需要历史数据,只需要指数当前权重。
但这种方法通常表现很差
因为它无法:
管控风险
调整因子暴露
利用 alpha 信号
控制波动
控制 tracking error
因此真实投资里极少使用。
✔️ 三、结论:指数增强常见做法是“两者结合”
实际指数增强流程是:
先确定股票池(可以是成分股、全 A、空气增强等)
收集指数当前权重(行业、市值、风格)—不需要历史
设定 KL 散度等暴露约束—不需要历史
设置优化目标(例如最大夏普、最小方差、最小 TE)—需要历史
求解最优组合
也就是说:
在指数增强中,KL 散度是“约束层”,不依赖历史;
优化目标是“目标层”,大部分都依赖历史。
所以最终结果是:
⭐ “指数增强策略整体上需要历史数据”,
但
⭐ “KL 散度/行业约束本身不需要历史数据”。
✔️ 四、一句话总结(你可以直接记)
指数增强的 KL 散度约束、行业约束、市值约束只需要指数当前权重,不需要历史数据;
但优化目标(如最小方差、最大夏普、最小 TE)需要历史数据,因此指数增强整体依赖历史数据。
——————概率游戏 ——————
概率资本:概率资本涉足全球化投资组合,包括多市场、多渠道、多产品。具体表现为股票(A股、港股、美股及其他国家二级市场)、期货、外汇、及一级股权投资市场。
顺势概率:趋势不会轻易形成,也不会轻易结束,一两个涨停跌停不足以改变趋势。顺势而为,概率优势是交易的理念。耐心等待属于自己的交易机会,赚自己看得懂的钱。
发布频率:一般情况下,每两周筛选一次(周二左右),特殊情况下会有所调整;心态及文章分享会不定时发送。
入场时机:交易机会不是做出来的,是等出来的。每次发布的入场时机基于第一入场时机原则,如果错过第一入场时机,就耐心等待下一个机会;下一次发布的时候如果入场机会还在,会继续入选,但如果有一段涨幅,可能就不再入选,但并不代表该标的没有继续上涨的机会,只是错过第一入场时机,激进的朋友可以追进去。这市场不缺机会,缺的是等待机会的耐心。
投资组合:每次发布交易机会列表会把符合交易机会的交易标的全部筛选出来,对数量没有强制要求。没有强制规定一次只能选20个、30个或者50个,如果一个都不符合,可能一个也不发布,如果都符合,可能都会发布,和数量无关,只和是否符合交易原则有关。
等待原则:弱水三千,只取一瓢饮。提高赢面,学会等待,放弃一切似是而非的机会;放弃、放弃、还是放弃, 放弃看不懂的复杂趋势;等待、等待、还是等待,等待能看懂的简单趋势。静静地等待,等待完全符合规则的机会出现,等待概率优势的机会出现,等待属于自己的机会。在等待概率优势机会的过程中,必须经得起各种诱惑,不要妄想抓住所有机会,只赚属于自己的钱,只交易属于自己的交易机会。
统计世界:万物有周期、世事有轮回。周期、轮回、钟摆。万事万物皆可统计,统计,世界,统计世界;世界,统计,世界统计;大盘统计,统计大盘;大盘追踪,追踪大盘。多市场、多品种、多产品、多周期、多技术、多角度、多维度、多层次、多种类、多世界、多技术指标、多统计、多追踪。多维度多角度进行统计、个体、全体、局部、全局、一个维度、两个维度、多个维度、不同角度。1个统计不够,来两个,两个统计不够来一百个,一百个不够来一万个。多高度、多角度、多维度统计。大盘统计、大盘追踪,这世界没什么不能统计的。万物相通,周期轮回,在统计的过程中,你会有意无意发现这世界的奥妙规律。
利弗莫尔:如果这一辈子我在投资交易中没有成功,并不是我没有这个能力,而是我自己不想成功。因为我已经知道了在市场中赢钱的办法:只要我有足够的耐心等待,只在市场的走势符合我的经验和理论,只在我有把握的范围内才行动,我就能赚到钱。而且,那样的机会早晚会出现的。如果我的投机事业最终失败了,肯定是因为我违背了自己的交易方法和经验教训,做了大量我自己也认为是错误的交易。例如,被市场走势诱惑追涨杀跌,无法控制自己贪婪的交易欲望,逆势交易,等等。
合作机会:资方、机构合作,可以直接留言。
欢迎关注微信公众号,后台回复【真实姓名-机构-职位-联系方式】加入概率资本交易圈。


