李建教授谈 AI 如何从工具走向 Alpha 研究【直播精品】- 大数跨境

首页

李建教授谈 AI 如何从工具走向 Alpha 研究【直播精品】

PandaAI个人量化超级助手

2026-06-01

导读：大模型进入量化投资，不只是“会不会写一个因子”。更关键的是，它能不能被放进一条有数据、有工具、有反馈、有约束的研究链条里。

社区精品直播

LIVE NOTES

从提效到 Alpha：大模型进入量化投资的下一步

从一场 PandaAI 社区直播出发，理解大模型如何从效率工具走向 Alpha 研究。

AI 在金融里的应用，可以先分成两类。

一类是效率提升工具，把原来由人完成的事情变得更加自动化；另一类是投资工具，让 AI 参与到金融市场里的超额收益发掘，也就是寻找 Alpha。

如果只是提效，问题是模型能不能更快地写代码、整理材料、生成会议记录、辅助执行任务。如果进入 Alpha 研究，问题就变成了：模型能不能提出有价值的假设，能不能接受回测和质疑，能不能解释结果，能不能在风险可控的前提下进入真实投研流程。

大模型进入量化投资，不只是“会不会写一个因子”。更关键的是，它能不能被放进一条有数据、有工具、有反馈、有约束的研究链条里。

本篇来自直播

直播主题：大模型在量化投资中的应用

分享嘉宾：李建教授，清华大学交叉信息研究院长聘教授，国家级青年人才计划入选者，发表国际高水平论文 100 余篇，荣获多项大奖，带领团队研发 Kronos 预测模型

核心问题

大模型在金融里，为什么不能只被理解为提效工具？
从因子研究到投研投顾，AI 真正能进入哪些研究链条？
越靠近 Alpha 和交易执行，为什么越需要验证、解释和控制？

两类应用

自动下单、会议记录、公告摘要、研报整理、程序辅助、研究流程自动化，都属于效率工具的应用。原来需要人花时间完成的动作，现在可以由 AI 更快完成。它提高的是流程效率。

但量化投资里更难的问题，是把 AI 当作寻找 Alpha 的工具。

提效工具还不是Alpha

人工智能在量化投资中并不是从大模型才开始应用。深度学习、强化学习、传统机器学习，已经在量化投资中有很多应用。最近几年，大语言模型受到关注，是因为它带来了几类新的能力。

大语言模型带来的几类新能力：

第一，它能处理语言数据，分析新闻、公告等非结构化信息，从中提取市场情绪和信号。
第二，它读过大量和量化相关的语料，可以提供新的研究思路、新的逻辑，并且有较强的编程能力，辅助量化程序设计。
第三，借助 Agent 技术，它可以参与更复杂的任务：自动挖掘因子、分析数据、生成策略，也可以作为交易智能体的一部分，为更复杂的研究和决策辅助提供支持。

这些能力看起来都指向“AI 量化”，但它们并不等同。

整理信息是一层，辅助研究是一层，参与因子挖掘和策略生成又是另一层。越往后，AI 面对的就越不是一个明确任务，而是一个研究问题：信号是否有效，因子是否有价值，策略逻辑是否经得起检验。

能力基础

理解大模型在量化中的应用，要先看它为什么走到今天。

人工智能从上世纪 40 年代开始发展，真正走进大众视野，一个重要节点是 2012 年深度神经网络在图像识别上的突破。之后，AlphaGo、AlphaFold、Transformer、ChatGPT 和 GPT-4 相继出现，大模型逐渐从“能聊天”走向“能推理”。

模型变强是因为能跑长链条

直播里有一个例子。

给模型一本书、9 个鸡蛋、一台笔记本、一个瓶子和一个钉子，让它判断怎样稳定地堆叠在一起。早期 ChatGPT 会给出“把鸡蛋放在钉子上”这类明显不合理的回答。GPT-4 则能想到，把鸡蛋排成 3 × 3 的正方形，放在书上，并留出空隙。

李建教授强调，这个例子之所以让人震惊，不在于模型说了一段自然语言，而在于它似乎通过大量文本“脑补”出了一个世界模型。它没有真正看到鸡蛋、书和钉子，却能推理出这些物体之间的关系。

后来的推理模型继续往前走。

在 GPT-4 时期，模型解决复杂数学推理任务还比较弱；到 OpenAI O1、DeepSeek R1 这类推理模型出现后，高中数学、竞赛题等任务的表现已经大幅提升。Deep Research 进一步把 Agent 能力推向复杂研究任务，可以搜索资料、阅读文献、整合信息，再给出研究报告。

这些能力和金融场景之间的关系，并不是“模型更聪明，所以可以直接交易”。

更准确地说，是模型开始具备处理长链条任务的基础：搜索、理解、编码、调用工具、拆分任务、整合信息、接受反馈。金融任务恰好需要这些能力，因为它面对的是数据、事件、预期、市场结构和交易约束之间的组合。

因子入口

在量化投资里，大模型最直观的入口是因子研究。

让大模型生成一个因子并不难。给它一个技术面方向，它可以写出 MACD 之类的因子；给它一个基本面方向，它也可以很快给出思路和代码。第一次使用时，模型的反应速度很容易让人觉得，因子研究的门槛被明显降低了。

但李建教授在直播里说得很直接：持续用下去，很快会发现大模型“就是那么三板斧”。

它来来回回可能就是十几条常见思路，很难产生特别多新的 idea。直接输出的因子，很多时候也只是刚入门的量化实习生能写出的水平。指标未必高，也很难自己持续改进。

这就是“写出一个因子”和“做因子研究”的区别。

因子研究真正困难的地方，不是公式本身，而是公式背后的逻辑、数据、处理方式、检验路径和失效风险。一个因子为什么可能有效，它有没有经济学逻辑，它有没有用到未来信息，它在样本外还能不能站住，它是不是因为复杂度过高而过拟合，这些问题不会因为大模型会写代码就消失。

写出因子不等于做完研究

Q&A 里的过拟合讨论，也补上了这条边界。

如果一个因子有比较扎实的经济学逻辑，一般不太容易只是靠样本碰巧成立；如果完全没有逻辑，只是数据驱动，复杂因子就更容易过拟合。样本外检测等统计方法可以帮助规避，但复杂因子本身确实更需要警惕。

所以，大模型可以给出起点，但起点不是研究的完成。

研究反馈链

多 Agent 协作设计因子，核心价值就在这里。

这套工作思路，是利用多个智能体协同设计量化因子。每个 Agent 有自己的上下文、提示词和记忆，也可以被赋予不同的知识背景。比如一个 Agent 更偏基本面知识，另一个 Agent 更偏技术面知识；一个先提出因子设计，另一个提出意见，再由第一个继续修改。

这个过程不是让两个模型聊天，而是让它们进入一条可反馈的研究链条。

Agent 可以调用工具：编码工具、回测工具、数据库。一个因子被提出后，不是停在文字答案里，而是进入代码、数据和回测结果。结果反馈回来，Agent 再继续修改。

直播中的例子，是围绕波动率调整成交量设计因子。

一个 Agent 在第 0 轮提出一个和波动率调整成交量相关的因子，回测后得到一个初始 IC。另一个 Agent 提出修改意见，比如对交易量做标准化和中心化。修改之后，因子指标出现提升。

多Agent的价值是反馈链

更关键的是后面的对比。

如果只让一个 Agent 自己反思、自己修改，IC 容易在原地震荡，改进不明显。让两个 Agent 进行讨论、修改和多轮交互，整体表现更容易出现提升。

这并不证明多 Agent 一定能生成好因子，也不证明 AI 可以自动带来收益。它证明的是另一件事：大模型开始有机会进入“提出假设、接受质疑、经过回测、继续修改”的研究流程。

量化研究本来就不是一次性给答案。

它是在一轮轮假设、验证和修正中，逐步逼近更可靠的信号。多 Agent 的价值，不是让模型显得更热闹，而是把大模型从单点输出，推向协作式、工具化、可反馈的研究迭代。

投研投顾

进入投研和投顾之后，模型面对的不再是单个文本，而是用户、资产、市场事件和价格变化之间的关系。

传统投资组合管理相对静态。大模型带来的新空间，是更交互式地理解用户的投资目标、风险偏好，以及重大事件对组合的影响。

但直接把通用大模型拿来做投顾并不合适。

一个很简单的原因是，大模型连复杂乘法都未必稳定。十位数乘十位数这类计算，通用模型经常会错。它要做精密金融任务，需要调用计算器、Python、专用优化算法和专业金融模型。

李建教授用了一个很形象的比喻：可以把大模型理解成一个刚毕业的大学生。它有知识，也有推理能力，但并不熟练。给它匹配工具、流程和专业约束后，它才可能做好投研投顾服务。

越靠近Alpha越需要控制

金融判断还需要足够的上下文。

比如一条重大新闻出现后，模型如果只看字面，往往会把“罚款”判断成坏事，把“利好”判断成好事。但投资里不是这样。利空如果早已被预期，落地后反而可能对股价是好事；利好如果已经被充分预期，真正公布后也可能下跌。

李建教授在直播中举了蚂蚁集团被罚款的例子。

如果只把“被罚款”这件事丢给模型，它会很自然地判断这是一件坏事。但如果从投资角度看，还要问：这件事是不是在预期之内？此前股价是否已经反映了这个预期？预期落地后，市场反应会不会反而变化？

真正让大模型分析事件，不能只给它新闻本身，还要给它背景信息、历史预期、股价近期走势，再让它综合判断。

它能分析语言，但金融判断不是字面理解。它需要数据源、背景信息、价格反应和专业工具共同支撑。

数据与模型边界

大模型不是传统机器学习的替代品。

Q&A 中有一个明确判断：大模型和传统机器学习做的事情不一样。传统机器学习，甚至更传统的线性模型，现在仍然是量化领域的主流，至少大部分资金仍然由这些传统模型或机器学习模型管理。

大模型更适合做研究和开发的辅助：帮助设计传统机器学习模型，帮助编码，帮助分析语言数据，或者作为更复杂的交易智能体的一部分。

高频数据就是一个典型边界。

直接把高频数据塞进大模型 prompt 里，并不见得有优势。大模型通常更适合语言分析和 coding。高频数据本身，可能还是需要更专精的模型。你可以让大模型帮你思考高频数据怎么做，或者帮你把已有思路写成代码，但这和“让大模型直接处理高频数据并取得优势”不是一回事。

舆情数据也是如此。

大模型可以做市场情绪分析，但数据源要明确。交易所公告相对干净，大型财经网站新闻也比较可靠；如果去全网乱爬，噪音和污染会非常多。像雪球这样的互联网平台，散户舆情也有人研究，但其中规律可能是反向的：当散户都很兴奋时，股票反而可能已经涨到头。

大模型进入量化，不是把所有数据都丢给模型，也不是抛弃已有方法，而是把模型放在合适的位置：它擅长语言、推理、编码和任务组织，但不擅长一切。

黑箱、共振和安全

大模型进入金融场景，风险不会自动减少。

第一个挑战，是幻觉。

直播中有两个很简单的例子：用大模型给小孩出鸡兔同笼这类数学题，有时候都会出错；一些大模型也曾经会判断 9.11 比 9.8 大。问题不只在于模型会错，还在于很多错误的原因很难精确定位。

学术界已经发现，大模型幻觉有很多原因，包括模型容量、低频知识遗忘等。但到今天，人们仍然不能对所有幻觉进行完整解释。

第二个挑战，是黑箱。

大模型非常复杂，很多决策路径很难定位。放到量化交易里，这会带来实际问题：如果模型给出一个判断，研究者未必能解释它为什么这样判断，也未必能预判它在极端市场下会怎么行动。

第三个挑战，是模型共振。

小微盘曾经出现过流动性踩踏，部分原因是很多量化策略在小微盘上有类似暴露。一旦小微盘产生危机，就可能形成集中卖出和流动性压力。复杂机器学习模型像黑箱一样，也会让这种共振更难提前判断。

第四个挑战，是 Agent 安全。

这类 Agent 工具可以调用工具、执行任务。错误一旦进入执行层，就不只是“回答错了”，而可能变成误删文件、错误交易、错误执行和真实损失。

所以，AI 量化的未来不只是能力问题，也是安全、可解释、可控和对齐问题。

模型越接近交易决策，越不能只看它能做什么，还要看它为什么这样做，什么时候会错，出了错能不能被发现和阻断。

回到 Alpha

回到 Alpha，问题不是大模型能不能参与量化，而是它以什么方式参与。

进入 Alpha 前，需要经过这些环节：

在因子研究里，它要经过经济逻辑、数据处理、回测和样本外检验。
在投研投顾里，它要获得足够的背景、预期和价格信息，还要调用计算器、优化算法和专业金融模型。
在交易和执行里，它要面对幻觉、黑箱、共振和安全控制。

如果这些环节缺席，模型生成得越快，风险也可能越快进入流程。

AI 让研究流程重新组织，但不替代研究判断。

人的工作不是消失，而是更集中地放在关键位置：定义问题，选择数据，判断逻辑，检查回测，解释风险，控制执行。

越靠近 Alpha，越需要验证。

越靠近决策，越需要解释。

越靠近执行，越需要控制。

大模型进入量化投资的下一步，不是让模型单独给出答案，而是让它进入一条可验证、可解释、可控制的研究链条。

「

Until next time

」

PandaAI 社区长期邀请交易者、研究者和开发者做直播分享，我们也会继续把其中值得留下来的经验整理成文章。

如果你也在用 AI 做量化研究，或正在从主观、工程、学术路径转向量化，欢迎来继续看直播、读分享、一起讨论。

>>> 更多一线分享，请访问 PandaAI 社区

【声明】内容源于网络

PandaAI个人量化超级助手

打破代码与数据壁垒，以 AI 驱动零门槛量化体验！无需代码即可轻松搭建多因子策略的量化智能体。

内容 83

粉丝 0

PandaAI个人量化超级助手打破代码与数据壁垒，以 AI 驱动零门槛量化体验！无需代码即可轻松搭建多因子策略的量化智能体。

总阅读1.2k

粉丝0

内容83