大数跨境
0
0

华泰 | 计算机:AI产业新范式

华泰 | 计算机:AI产业新范式 华泰证券科技研究
2025-11-13
8
导读:2026年投资峰会速递

点击小程序查看研报原文



核心观点

11月5-6日,我们组织了2026年度投资峰会,我们看到:1)Scaling Law 2.0 时代下,合成数据打开训练数据天花板,Mid Training范式重塑模型演进路径;2)AI应用层面商业化步入规模化阶段,Agent能力与交易闭环融合带动产业落地加速。


核心亮点

1模型:算力扩张仍是核心增长引擎我们观察到,在Scaling Law持续演进的背景下,模型能力的提升正从“数据—算力—算法”三要素的线性关系,转向以“数据生成与利用效率”为核心的非线性增长阶段。合成数据持续扩大训练资源池,推动训练tokens规模显著上行;与此同时,算力仍是大模型演进的底层约束与增长引擎,2010-2024年代表性模型训练算力年均增长4-5倍,头部模型更达到9倍水平。我们判断,算力扩张仍将构成行业演进的核心节奏,前沿模型单次完整训练成本或在2027年达到十亿美元量级。


2、训练:Mid Training范式进一步拓展训练边界。Mid Training成为Scaling Law 2.0阶段的重要标志,其通过将强化学习(RL)从后训练阶段前移至中间环节,实现算力对数据的自我生成与最优分配。该范式在多智能体辩论(Multi-Agent Debate)等机制下生成数据量远超人工标注,并通过动态权重分配提升RL训练质量与数据利用率。我们认为,Mid Training的应用使模型在保持算力投入强度的同时进一步提升数据利用效率,有望突破传统Scaling Law下的性能边界,打开模型能力上限。


3、Agent:GPT-5确立“统一系统”方向,推动智能体架构标准化。GPT-5以统一架构实现快思与深思的自适应协同,并通过实时路由器(Real-time Router)按任务复杂度动态分配算力资源,实现速度与思考深度的平衡。该架构代表行业向“多模型一体化、动态资源分配”的智能系统方向演进,后续DeepSeek V3.1与Grok 4 Fast等产品的快速跟进验证了这一趋势。我们认为,GPT-5确立的统一系统范式将成为行业架构标准化的重要方向,有望显著提升智能体在复杂场景中的响应效率与稳定性,推动AI从功能集成向认知协同阶段迈进。


4、应用:Agent交易闭环融合打开新一轮落地周期。头部厂商战略重心开始从模型能力转向商业化生态构建。OpenAI推出Agentic Commerce Protocol(ACP),使AI Agent具备直接交易能力,实现从“推荐”到“结算”的全链路闭环,标志AI应用正式进入可量化ROI的商业阶段。全球AI应用正从产品化(2023)→ 商业化试点(2024)→ 规模化落地(2025)三阶段演进,2B端应用渗透存量客户,2C端使用时长与用户规模持续扩张。我们判断,海外厂商已进入规模化放量初期,国内厂商受益于DeepSeek-R1等模型突破,应用节奏显著加快,部分AI应用(深度研究、企业问数)已具备大规模商业化能力。我们认为,随着Agent与交易协议的深度结合、ROI体系的持续明晰,AI应用的产业价值释放正全面进入加速期。


风险提示:宏观经济波动;技术落地不及预期;本研报中涉及到未上市公司和未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。



正文

模型:Scaling Law 2.0时代的新变化

Scaling Law仍在持续,其含义更加丰富。伴随Scaling law在预训练、后训练与推理阶段的持续演进,其体现形式愈加丰富,具体体现在两个方面:1)合成数据进一步扩大训练资源,驱动算力、训练数据持续扩张;2)训练数据的高效利用成为关键,中训练等训练方法得到重视。


训练数据与算力仍在持续扩大

合成数据等驱动训练数据Token规模持续走高。据Artificial Analysis统计,典型开源模型的训练数据常见在10—15万亿tokens,被视为可免费获取并高质量清洗后的网络数据量级。头部厂商通过新增标注与合成数据等方法持续扩容训练数据tokens,新近模型的训练tokens继续上行:例如阿里Qwen系列由18万亿提升至36万亿,Meta在训练Llama 4 Scout时引入部分社交数据,使总体训练数据约达40万亿。我们认为,随“垂类”数据与新标注数据的不断累积,训练tokens仍将增加,且从模型泛化性和性能表现来看,OpenAI、Google等头部模型的训练规模或高于公开口径。


训练算力仍在持续扩张。根据Epoch AI在《Training Compute of Frontier AI Models Grows by 4–5x per Year》中的测算,2010年至2024年间,具代表性的前沿模型训练所需算力的年均增长倍数约为4-5倍。这一趋势在主要科技企业的旗舰模型中表现一致,显示出业界对算力扩展的持续依赖。值得注意的是,最头部的语言模型的增长趋势更快,在2017年6月至2024年5月期间,其增长速度高达每年9倍。从2025年发布的新前沿模型来看,仍然没有放缓。根据Epoch AI的研究《How Much Does It Cost to Train Frontier AI Models》,2016-2024年中具有代表性的前沿模型训练成本年均增长约2.4倍(区间为2.0-3.1倍),若按云端算力租用价格计算,增速约为2.6倍。我们认为,若这一增长趋势延续,预计至2027年前沿模型的单次完整训练成本或将达到十亿美元量级。我们认为,在当前阶段算力仍是大模型能力演进的底层约束与增长引擎,其年均4-5倍的扩张速度构成了行业发展的核心节奏。



Mid Training进一步打开训练规模边际

Mid Training 范式的出现进一步扩张了训练数据,同时提升了训练数据的利用效率。伴随模型在强化学习阶段的算力用量不断提升,RL逐步从传统的post training独立,与原有的Later stage pre training整合成为新的Mid Training。Mid Training 近似于使用算力换取数据,核心是构建一个强化学习与评估环境,让模型可以自行合成数据来提升性能。大量的生成数据,特别在 Multi Agent Debate 环节生产数据的量十分庞大,远远超过了人类生产数据的效率。同时Mid training的范式要求模型在训练过程中选择最优的训练数据分配权重,从而提升RL训练质量与数据的利用效率。我们认为,Mid Training的重视程度不断提升,进一步打开了训练数据的规模边际,有望带动基模能力上限进一步提升。



GPT-5确立了行业内模型“统一系统”的方向

GPT-5以统一架构实现快思与深思的自适应协同,并以路由器按任务动态分配资源。具体而言,体系由基础模型(Smart model)承担多数日常问答,深度推理模型(GPT-5 Thinking)处理复杂任务中的长期思考,实时路由器(Real-time Router)依据对话类型、问题复杂度、工具调用与用户意图(如“认真思考”提示)在两类模型间动态选择与切换。路由器持续学习用户信号(如模型切换行为、回答偏好、正确率等)以优化决策,并规划在后续将三者进一步融合为单一模型,以在保证速度的同时提升思考深度与一致性。GPT 5.0发布后,DeepSeek V3.1、Grok 4 Fast迅速跟进,推出类似的统一自适应的模型路由功能。我们认为,该架构有利于在不同使用场景下兼顾响应效率与推理质量。



应用:商业化规模化进展加速

头部厂商重心开始向应用和商业化生态转移

OpenAI推出Agentic Commerce Protocol(代理商务协议,ACP),标志其正式将智能体(Agent)能力延伸至商业交易场景。该协议由OpenAI与Stripe联合开发,旨在让AI Agent具备直接执行购买行为的能力,实现从“推荐商品”到“完成交易”的全流程自动化。10月6日2025年OpenAI开发者大会上,OpenAI再次明确在支付侧引入Agentic Commerce Protocol的“对话内即时结账”,并强调不止电商,后续各类接入ChatGPT的App均可能通过ACP实现变现。对话即入口、结账不外跳,已订阅用户可在对话直接登录,未来支持多种变现,使交易链路由“触达—体验—转化”在同一会话内闭合,显著降低流失点并便于归因与运营。我们认为,ACP将把会话从信息交互延伸为交易承载,提升单位会话的转化效率与可运营性,成为商业化的关键抓手。



AI应用进入规模商业化阶段

全球AI应用逐步迭代,经历产品化落地(2023年)、商业化试点(2024年)、规模化探索(2025年)三大产业阶段。1)产品化:2023年ChatGPT作为现象级应用,成功带动软件AI升级热潮,但此阶段受制于模型能力有限,AI应用多数仍为问答式应用,成熟度较低;2)商业化:2024年得益于基础模型能力升级(OpenAI发布推理能力较强的o系列模型),AI应用从问答式Chatbot向Agent升级,同时开启商业化试点推进;3)规模化:2025年AI应用进入规模化放量前期,2B应用加速实现存量客户覆盖,2C应用用户数及用户使用时长持续增长。



从全球视角看,海内外AI应用的产业差距正逐步收窄,中国AI应用实现加速追赶。受益于大模型基础能力、模型调用成本、客户付费意愿等因素改善,海外与国内的AI应用产业差距逐步收窄,目前均处于规模化放量前期阶段。1)海外:海外AI应用产业节奏为23年产品发布、24年商业试点、25年初步实现规模化放量;2)中国:国内AI应用产业节奏早期稍显滞后,23年多数企业AI应用仍处在概念阶段;24年字节跳动、腾讯、阿里等科技大厂的AI应用陆续发布,国内软件厂商AI升级同步跟进,部分2B AI应用开启商业化试点;25年DeepSeek-R1模型发布后,国内应用产业节奏显著提速,目前多数AI应用完成商业化试点,部分AI应用(深度研究、企业问数)已具备规模化能力。



总体我们认为,全球AI产业在算力、模型与应用环节的进展仍在加速。以OpenAI为代表的头部厂商在推理需求、模型架构及商业化生态上不断突破,推动AI算力建设迈入加速阶段。算力端,全球大模型训练与推理的复杂度持续提升,GPU集群与高速互联网络建设进入高景气周期,新型融资方式的创新有效支撑了数据中心的资本开支扩张;模型端,Scaling Law 2.0与Mid Training等范式演化显著提升了数据利用效率与模型上限,GPT-5的“统一系统”架构确立了未来智能体模型的演进方向;应用端,AI产品加速从试点走向规模化落地,商业化路径逐渐清晰,智能体化与交易闭环成为核心趋势。展望未来,我们认为,AI算力基础设施将持续成为科技产业的核心增量来源,模型能力迭代与应用生态扩张将共同驱动全球算力产业链维持高景气。


风险提示

宏观经济波动。若宏观经济波动,产业变革及新技术的落地节奏或将受到影响,宏观经济波动还可能对IT投资产生负面影响,从而导致整体行业增长不及预期。


技术落地不及预期。若AI等技术落地不及预期,或对计算机行业公司整体产品迭代、收入增长节奏产生负面影响。


本研报中涉及到未上市公司和未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。


相关研报

研报:《2026年投资峰会速递—— AI产业新范式》2025年11月10日

谢春生 分析师 S0570519080006 | BQZ938

郭雅丽 分析师 S0570515060003 | BQB164

范昳蕊 分析师 S0570521060004 | BWD469

袁泽世 分析师 S0570524090001

岳铂雄 分析师 S0570524080004

王浩天 联系人 S0570125010006
徐诚伟 联系人 S0570125070089


关注我们


华泰证券研究所国内站(研究Portal)

https://inst.htsc.com/research

访问权限:国内机构客户


华泰证券研究所海外站

https://intl.inst.htsc.com/research 

访问权限:美国及香港金控机构客户
添加权限请联系您的华泰对口客户经理

免责声明

▲向上滑动阅览

本公众号不是华泰证券股份有限公司(以下简称“华泰证券”)研究报告的发布平台,本公众号仅供华泰证券中国内地研究服务客户参考使用。其他任何读者在订阅本公众号前,请自行评估接收相关推送内容的适当性,且若使用本公众号所载内容,务必寻求专业投资顾问的指导及解读。华泰证券不因任何订阅本公众号的行为而将订阅者视为华泰证券的客户。

本公众号转发、摘编华泰证券向其客户已发布研究报告的部分内容及观点,完整的投资意见分析应以报告发布当日的完整研究报告内容为准。订阅者仅使用本公众号内容,可能会因缺乏对完整报告的了解或缺乏相关的解读而产生理解上的歧义。如需了解完整内容,请具体参见华泰证券所发布的完整报告。

本公众号内容基于华泰证券认为可靠的信息编制,但华泰证券对该等信息的准确性、完整性及时效性不作任何保证,也不对证券价格的涨跌或市场走势作确定性判断。本公众号所载的意见、评估及预测仅反映发布当日的观点和判断。在不同时期,华泰证券可能会发出与本公众号所载意见、评估及预测不一致的研究报告。

在任何情况下,本公众号中的信息或所表述的意见均不构成对任何人的投资建议。订阅者不应单独依靠本订阅号中的内容而取代自身独立的判断,应自主做出投资决策并自行承担投资风险。订阅者若使用本资料,有可能会因缺乏解读服务而对内容产生理解上的歧义,进而造成投资损失。对依据或者使用本公众号内容所造成的一切后果,华泰证券及作者均不承担任何法律责任。

本公众号版权仅为华泰证券所有,未经华泰证券书面许可,任何机构或个人不得以翻版、复制、发表、引用或再次分发他人等任何形式侵犯本公众号发布的所有内容的版权。如因侵权行为给华泰证券造成任何直接或间接的损失,华泰证券保留追究一切法律责任的权利。华泰证券具有中国证监会核准的“证券投资咨询”业务资格,经营许可证编号为:91320000704041011J。

【声明】内容源于网络
0
0
华泰证券科技研究
1234
内容 934
粉丝 0
华泰证券科技研究 1234
总阅读2.8k
粉丝0
内容934