大数跨境

李建教授谈 AI 如何从工具走向 Alpha 研究【直播精品】

李建教授谈 AI 如何从工具走向 Alpha 研究【直播精品】 PandaAI个人量化超级助手
2026-06-01
1
导读:大模型进入量化投资,不只是“会不会写一个因子”。更关键的是,它能不能被放进一条有数据、有工具、有反馈、有约束的研究链条里。
社区精品直播
LIVE NOTES
从提效到 Alpha:大模型进入量化投资的下一步

从一场 PandaAI 社区直播出发,理解大模型如何从效率工具走向 Alpha 研究。

AI 在金融里的应用,可以先分成两类。

一类是效率提升工具,把原来由人完成的事情变得更加自动化;另一类是投资工具,让 AI 参与到金融市场里的超额收益发掘,也就是寻找 Alpha。

如果只是提效,问题是模型能不能更快地写代码、整理材料、生成会议记录、辅助执行任务。如果进入 Alpha 研究,问题就变成了:模型能不能提出有价值的假设,能不能接受回测和质疑,能不能解释结果,能不能在风险可控的前提下进入真实投研流程。

大模型进入量化投资,不只是“会不会写一个因子”。更关键的是,它能不能被放进一条有数据、有工具、有反馈、有约束的研究链条里。

本篇来自直播

直播主题:大模型在量化投资中的应用

分享嘉宾:李建教授,清华大学交叉信息研究院长聘教授,国家级青年人才计划入选者,发表国际高水平论文 100 余篇,荣获多项大奖,带领团队研发 Kronos 预测模型

核心问题
  1. 大模型在金融里,为什么不能只被理解为提效工具?

  2. 从因子研究到投研投顾,AI 真正能进入哪些研究链条?

  3. 越靠近 Alpha 和交易执行,为什么越需要验证、解释和控制?

两类应用

自动下单、会议记录、公告摘要、研报整理、程序辅助、研究流程自动化,都属于效率工具的应用。原来需要人花时间完成的动作,现在可以由 AI 更快完成。它提高的是流程效率。

但量化投资里更难的问题,是把 AI 当作寻找 Alpha 的工具。

提效工具还不是Alpha

人工智能在量化投资中并不是从大模型才开始应用。深度学习、强化学习、传统机器学习,已经在量化投资中有很多应用。最近几年,大语言模型受到关注,是因为它带来了几类新的能力。

大语言模型带来的几类新能力:

  1. 第一,它能处理语言数据,分析新闻、公告等非结构化信息,从中提取市场情绪和信号。

  2. 第二,它读过大量和量化相关的语料,可以提供新的研究思路、新的逻辑,并且有较强的编程能力,辅助量化程序设计。

  3. 第三,借助 Agent 技术,它可以参与更复杂的任务:自动挖掘因子、分析数据、生成策略,也可以作为交易智能体的一部分,为更复杂的研究和决策辅助提供支持。

这些能力看起来都指向“AI 量化”,但它们并不等同。

整理信息是一层,辅助研究是一层,参与因子挖掘和策略生成又是另一层。越往后,AI 面对的就越不是一个明确任务,而是一个研究问题:信号是否有效,因子是否有价值,策略逻辑是否经得起检验。

能力基础

理解大模型在量化中的应用,要先看它为什么走到今天。

人工智能从上世纪 40 年代开始发展,真正走进大众视野,一个重要节点是 2012 年深度神经网络在图像识别上的突破。之后,AlphaGo、AlphaFold、Transformer、ChatGPT 和 GPT-4 相继出现,大模型逐渐从“能聊天”走向“能推理”。

模型变强是因为能跑长链条

直播里有一个例子。

给模型一本书、9 个鸡蛋、一台笔记本、一个瓶子和一个钉子,让它判断怎样稳定地堆叠在一起。早期 ChatGPT 会给出“把鸡蛋放在钉子上”这类明显不合理的回答。GPT-4 则能想到,把鸡蛋排成 3 × 3 的正方形,放在书上,并留出空隙。

李建教授强调,这个例子之所以让人震惊,不在于模型说了一段自然语言,而在于它似乎通过大量文本“脑补”出了一个世界模型。它没有真正看到鸡蛋、书和钉子,却能推理出这些物体之间的关系。

后来的推理模型继续往前走。

在 GPT-4 时期,模型解决复杂数学推理任务还比较弱;到 OpenAI O1、DeepSeek R1 这类推理模型出现后,高中数学、竞赛题等任务的表现已经大幅提升。Deep Research 进一步把 Agent 能力推向复杂研究任务,可以搜索资料、阅读文献、整合信息,再给出研究报告

这些能力和金融场景之间的关系,并不是“模型更聪明,所以可以直接交易”。

更准确地说,是模型开始具备处理长链条任务的基础:搜索、理解、编码、调用工具、拆分任务、整合信息、接受反馈。金融任务恰好需要这些能力,因为它面对的是数据、事件、预期、市场结构和交易约束之间的组合。

因子入口

在量化投资里,大模型最直观的入口是因子研究。

让大模型生成一个因子并不难。给它一个技术面方向,它可以写出 MACD 之类的因子;给它一个基本面方向,它也可以很快给出思路和代码。第一次使用时,模型的反应速度很容易让人觉得,因子研究的门槛被明显降低了。

但李建教授在直播里说得很直接:持续用下去,很快会发现大模型“就是那么三板斧”。

它来来回回可能就是十几条常见思路,很难产生特别多新的 idea。直接输出的因子,很多时候也只是刚入门的量化实习生能写出的水平。指标未必高,也很难自己持续改进。

这就是“写出一个因子”和“做因子研究”的区别。

因子研究真正困难的地方,不是公式本身,而是公式背后的逻辑、数据、处理方式、检验路径和失效风险。一个因子为什么可能有效,它有没有经济学逻辑,它有没有用到未来信息,它在样本外还能不能站住,它是不是因为复杂度过高而过拟合,这些问题不会因为大模型会写代码就消失。

写出因子不等于做完研究

Q&A 里的过拟合讨论,也补上了这条边界。

如果一个因子有比较扎实的经济学逻辑,一般不太容易只是靠样本碰巧成立;如果完全没有逻辑,只是数据驱动,复杂因子就更容易过拟合。样本外检测等统计方法可以帮助规避,但复杂因子本身确实更需要警惕。

所以,大模型可以给出起点,但起点不是研究的完成。

研究反馈链

多 Agent 协作设计因子,核心价值就在这里。

这套工作思路,是利用多个智能体协同设计量化因子。每个 Agent 有自己的上下文、提示词和记忆,也可以被赋予不同的知识背景。比如一个 Agent 更偏基本面知识,另一个 Agent 更偏技术面知识;一个先提出因子设计,另一个提出意见,再由第一个继续修改。

这个过程不是让两个模型聊天,而是让它们进入一条可反馈的研究链条。

Agent 可以调用工具:编码工具、回测工具、数据库。一个因子被提出后,不是停在文字答案里,而是进入代码、数据和回测结果。结果反馈回来,Agent 再继续修改。

直播中的例子,是围绕波动率调整成交量设计因子。

一个 Agent 在第 0 轮提出一个和波动率调整成交量相关的因子,回测后得到一个初始 IC。另一个 Agent 提出修改意见,比如对交易量做标准化和中心化。修改之后,因子指标出现提升。

多Agent的价值是反馈链

更关键的是后面的对比。

如果只让一个 Agent 自己反思、自己修改,IC 容易在原地震荡,改进不明显。让两个 Agent 进行讨论、修改和多轮交互,整体表现更容易出现提升。

这并不证明多 Agent 一定能生成好因子,也不证明 AI 可以自动带来收益。它证明的是另一件事:大模型开始有机会进入“提出假设、接受质疑、经过回测、继续修改”的研究流程。

量化研究本来就不是一次性给答案。

它是在一轮轮假设、验证和修正中,逐步逼近更可靠的信号。多 Agent 的价值,不是让模型显得更热闹,而是把大模型从单点输出,推向协作式、工具化、可反馈的研究迭代。

投研投顾

进入投研和投顾之后,模型面对的不再是单个文本,而是用户、资产、市场事件和价格变化之间的关系。

传统投资组合管理相对静态。大模型带来的新空间,是更交互式地理解用户的投资目标、风险偏好,以及重大事件对组合的影响。

但直接把通用大模型拿来做投顾并不合适。

一个很简单的原因是,大模型连复杂乘法都未必稳定。十位数乘十位数这类计算,通用模型经常会错。它要做精密金融任务,需要调用计算器、Python、专用优化算法和专业金融模型。

李建教授用了一个很形象的比喻:可以把大模型理解成一个刚毕业的大学生。它有知识,也有推理能力,但并不熟练。给它匹配工具、流程和专业约束后,它才可能做好投研投顾服务

越靠近Alpha越需要控制

金融判断还需要足够的上下文。

比如一条重大新闻出现后,模型如果只看字面,往往会把“罚款”判断成坏事,把“利好”判断成好事。但投资里不是这样。利空如果早已被预期,落地后反而可能对股价是好事;利好如果已经被充分预期,真正公布后也可能下跌。

李建教授在直播中举了蚂蚁集团被罚款的例子。

如果只把“被罚款”这件事丢给模型,它会很自然地判断这是一件坏事。但如果从投资角度看,还要问:这件事是不是在预期之内?此前股价是否已经反映了这个预期?预期落地后,市场反应会不会反而变化?

真正让大模型分析事件,不能只给它新闻本身,还要给它背景信息、历史预期、股价近期走势,再让它综合判断。

它能分析语言,但金融判断不是字面理解。它需要数据源、背景信息、价格反应和专业工具共同支撑。

数据与模型边界

大模型不是传统机器学习的替代品。

Q&A 中有一个明确判断:大模型和传统机器学习做的事情不一样。传统机器学习,甚至更传统的线性模型,现在仍然是量化领域的主流,至少大部分资金仍然由这些传统模型或机器学习模型管理。

大模型更适合做研究和开发的辅助:帮助设计传统机器学习模型,帮助编码,帮助分析语言数据,或者作为更复杂的交易智能体的一部分。

高频数据就是一个典型边界。

直接把高频数据塞进大模型 prompt 里,并不见得有优势。大模型通常更适合语言分析和 coding。高频数据本身,可能还是需要更专精的模型。你可以让大模型帮你思考高频数据怎么做,或者帮你把已有思路写成代码,但这和“让大模型直接处理高频数据并取得优势”不是一回事。

舆情数据也是如此。

大模型可以做市场情绪分析,但数据源要明确。交易所公告相对干净,大型财经网站新闻也比较可靠;如果去全网乱爬,噪音和污染会非常多。像雪球这样的互联网平台,散户舆情也有人研究,但其中规律可能是反向的:当散户都很兴奋时,股票反而可能已经涨到头。

大模型进入量化,不是把所有数据都丢给模型,也不是抛弃已有方法,而是把模型放在合适的位置:它擅长语言、推理、编码和任务组织,但不擅长一切。

黑箱、共振和安全

大模型进入金融场景,风险不会自动减少。

第一个挑战,是幻觉。

直播中有两个很简单的例子:用大模型给小孩出鸡兔同笼这类数学题,有时候都会出错;一些大模型也曾经会判断 9.11 比 9.8 大。问题不只在于模型会错,还在于很多错误的原因很难精确定位。

学术界已经发现,大模型幻觉有很多原因,包括模型容量、低频知识遗忘等。但到今天,人们仍然不能对所有幻觉进行完整解释。

第二个挑战,是黑箱。

大模型非常复杂,很多决策路径很难定位。放到量化交易里,这会带来实际问题:如果模型给出一个判断,研究者未必能解释它为什么这样判断,也未必能预判它在极端市场下会怎么行动。

第三个挑战,是模型共振。

小微盘曾经出现过流动性踩踏,部分原因是很多量化策略在小微盘上有类似暴露。一旦小微盘产生危机,就可能形成集中卖出和流动性压力。复杂机器学习模型像黑箱一样,也会让这种共振更难提前判断。

第四个挑战,是 Agent 安全。

这类 Agent 工具可以调用工具、执行任务。错误一旦进入执行层,就不只是“回答错了”,而可能变成误删文件、错误交易、错误执行和真实损失。

所以,AI 量化的未来不只是能力问题,也是安全、可解释、可控和对齐问题。

模型越接近交易决策,越不能只看它能做什么,还要看它为什么这样做,什么时候会错,出了错能不能被发现和阻断。

回到 Alpha

回到 Alpha,问题不是大模型能不能参与量化,而是它以什么方式参与。

进入 Alpha 前,需要经过这些环节:

  • 在因子研究里,它要经过经济逻辑、数据处理、回测和样本外检验。

  • 在投研投顾里,它要获得足够的背景、预期和价格信息,还要调用计算器、优化算法和专业金融模型。

  • 在交易和执行里,它要面对幻觉、黑箱、共振和安全控制。

如果这些环节缺席,模型生成得越快,风险也可能越快进入流程。

AI 让研究流程重新组织,但不替代研究判断。

人的工作不是消失,而是更集中地放在关键位置:定义问题,选择数据,判断逻辑,检查回测,解释风险,控制执行。

越靠近 Alpha,越需要验证。

越靠近决策,越需要解释。

越靠近执行,越需要控制。

大模型进入量化投资的下一步,不是让模型单独给出答案,而是让它进入一条可验证、可解释、可控制的研究链条。



Until next time 




PandaAI 社区长期邀请交易者、研究者和开发者做直播分享,我们也会继续把其中值得留下来的经验整理成文章。
如果你也在用 AI 做量化研究,或正在从主观、工程、学术路径转向量化,欢迎来继续看直播、读分享、一起讨论。
>>> 更多一线分享,请访问 PandaAI 社区 


【声明】内容源于网络
0
0
PandaAI个人量化超级助手
打破代码与数据壁垒,以 AI 驱动零门槛量化体验!无需代码即可轻松搭建多因子策略的量化智能体。
内容 83
粉丝 0
PandaAI个人量化超级助手 打破代码与数据壁垒,以 AI 驱动零门槛量化体验!无需代码即可轻松搭建多因子策略的量化智能体。
总阅读1.2k
粉丝0
内容83