拾象2025 AI预测复盘:20项关键判断验证与启示
去年此时,我们在《2025 AI Best Ideas》中提出20项关键预测。12个月后回看,多数判断高度应验,但在技术进步速度、基建成熟度及AI交易复杂性上存在适度乐观偏差。
2026年将在“AI Bubble”争议中开启。World Model、多模态、机器人及新范式等积极信号预示行业将持续突破;而OpenAI高达1.4万亿美元的资本开支,则意味着市场对AI的预期已被充分定价,后续增长需持续超预期兑现。
以下为拾象团队2025年度预测复盘。我们也诚邀读者分享对2026年AI发展的期待与思考,共同参与“2026 AI Best Ideas”讨论。
⬇️ 滑动或点击查看大图 ⬇️
⬆️ 滑动或点击查看大图 ⬆️
01 微软投资Anthropic,模型与云格局彻底改变
预测结果:正确
拾象预测:2025年OpenAI将完成商业化转型,微软亦将投资Anthropic,推动模型与云关系从“独家绑定”走向全面开放——Anthropic深度接入Azure,OpenAI则与Oracle、AWS共建算力基建,最终实现“所有模型上所有云,所有云支持所有模型”。
2025实际:
- 微软年初收购Inflection AI组建自研LLM团队,年底宣布战略投资Anthropic;Claude系列模型已上线Azure;
- OpenAI完成PBO架构转型并引入多元财务投资人,与Oracle共建算力网络,并与AWS签署为期多年、价值380亿美元的合作协议,正式结束对Azure的独家依赖。
02 Google手握王牌逆转颓势,成为“最领先的追随者”
预测结果:正确
拾象预测:Google虽在LLM训练进度上落后于OpenAI与Anthropic,但其TPU算力、Android/Chrome分发渠道及DeepMind人才储备构成三大核心优势;市场对其搜索业务被颠覆的担忧,正加速其AI战略重构。
2025实际:
- Q4发布的Gemini 3重新确立其“AI王者”地位,引发业界对“谷链-达链AI War”的广泛讨论;
- 此前半年市场普遍将其定义为“AI looser”,Coatue Fancy 40榜单甚至未纳入Google;
- 其反转印证了“强者恒强”逻辑——在AI原生挑战者尚未成熟前,拥有云、算力与分发渠道的科技巨头仍将是最大赢家。
03 下一代Mega 7已有雏形:OS才是最高护城河,模型公司进入Agent OS之争
预测结果:正确
拾象预测:当前模型厂商竞争本质是80年代Windows/DOS战争重演,核心围绕开发者心智份额、生态、专有标准与API。OS是终极护城河;Anthropic构建OS的决心最强,MCP即新时代TCP/IP;Agent将成为LLM OS之上的App。
2025实际:
- Anthropic发布MCP后推出Claude Skills,通过封装SOP知识提升App分发效率;
- OpenAI App SDK尝试复刻iOS App Store逻辑,既是API,更是定义“Agent运行标准”的基础设施,意在掌控应用层分发权;
- Agentic Commerce协议爆发,OpenAI、Anthropic与Google均发布自有协议,争夺数字经济“最后一公里”。
04 Agent是新软件,Coding Agent率先落地
预测结果:正确
拾象预测:软件本质是人类行为与工作流的数字化映射;当模型具备Tool Use能力,即可从1.0规则式软件升级为2.0动态编排式Agent;AI Coding将率先突破,从IDE内联补全(Copilot)进化至“给需求→生成→改造项目”全流程Agentic工作流。
2025实际:
- Claude Code推动AI Coding主流化,ARR突破10亿美元;Cursor ARR与估值均实现10倍以上增长;
- 模型大厂密集入场Coding赛道,与创业公司同台竞争;
- Google以“收购式招聘”方式拿下Winsurf,凸显对Coding场景的战略重视。
以Coding Agent为代表的Agentic AI获得巨额资源投入,根本驱动力在于市场对LLM从“助理”迈向“价值创造者”的共识——Proactive Agent已成为下一阶段技术研发与产品落地的核心方向。
05 Task automation成为关键词,long horizon task成功率是衡量Agent能力的核心指标
预测结果:正确
拾象预测:当前Agent仍处初级阶段,聚焦高重复性、需一定灵活性的任务自动化(如客服、售前、游戏测试);进阶Agent需更强的Reasoning能力、长程任务处理能力及Large Context理解能力,是模型公司投入重点。
2025实际:
- AI独立研究机构METR数据显示,Agent可完成任务长度正以指数级增长,约每7个月翻倍;预计2029年可支持时长为1个工作月的任务;
- Agent Infra赛道全面升温,围绕Environment、Context、Tools与Agent Security,模型公司、云厂商与初创企业竞相布局,n8n、Supabase、Browserbase等公司脱颖而出。
06 Context layer成为Agent的秘密武器:数据、推理、行动三元素重构的context是Agent落地基础设施
预测结果:正确
拾象预测:RAG已无法满足复杂Agent需求,Context Layer成为优先级最高的基础设施能力;如何获取并构建企业级Context,将成为AI应用与数据公司的核心竞争力;Palantir是二级市场明确受益者;Perplexity收购Carbon即为强化与Docs/Slack/Notion等工具的数据连接。
2025实际:
- Palantir FDE(Forward Deployed Engineer)模式走红;Karpathy提出的“Context Engineering”成为开发者高频术语;
- 拖慢Agent落地的瓶颈已从流程设计转向上下文性能瓶颈,“何时提供何种信息”升维为超越Prompt Engineering与RAG的核心方法论;
- Context Engineering实质是LLM OS时代的软件工程,当下大多数优秀AI初创公司或AI Native应用的核心能力即为此。
07 训练靠后,推理向前,ASIC叙事减弱,NV算力领导地位稳固,市值达5万亿美元
预测结果:部分验证
拾象预测:O1开启的System 2思维链时代带来指数级Test-time Compute需求,对内存带宽与互连能力要求极高;硬件性能与系统效率压倒成本考量,高端推理需求大规模回流NVIDIA生态;CSP自研芯片叙事弱化,AMD市占率承压。
2025实际:
- NVIDIA市值年内突破5万亿美元;GB200在TCO与性能端维持绝对领导地位;
- AWS Trainium/Inferentia出货增长但受限于软件生态与性能瓶颈,难以承接前沿模型负载;Google TPU依托Gemini构建闭环;
- AMD收购ZT System补强技术路线,长期格局优于预期。
08 Pre-training、Post-training、o3融合一体化,large scale RL成为关键bet
预测结果:正确
拾象预测:O系列使Post-training重要性大幅提升,其算力消耗与能力解锁潜力可能超过Pre-training;二者边界日益模糊;RL将渐进式渗透Pre-training后期,用合成数据拓展分布外高质量数据,突破智能天花板。
2025实际:
- 算力投入重心已由Pre-training转向RL Scaling;单纯增加参数带来的性能提升已入平缓期;数学、Coding等前沿Benchmark的跃升主要来自Post-training阶段的RL优化与Reasoning增强;
- Post-training不再“锦上添花”,而成为与Pre-training量级相当的核心训练阶段;
- OpenAI夏季提出Mid-Training组织形式,本质是将Post-training目标前置至Pre-training后期,属大模型公司规模化后的必然选择。
09 合成数据实现技术突破,规模化合成数据减缓数据撞墙焦虑
预测结果:错误
拾象预测:合成数据是突破Pre-training数据瓶颈的关键路径,2025年有望取得实质性进展。
2025实际:
- 过度依赖模型自身生成的合成数据易导致Model Collapse与特征同质化,违背信息熵原理;
- 真正突破点不在“量”的合成,而在“质”的筛选——Expert Curated Data(专家策展数据)崛起;Mercor等平台因提供高质量RL训练燃料(专家标注验证数据)而快速突围;
- RL Scaling中,精准Reward Signal仍高度依赖人类专家智慧。
10 “o3”模型验证推理规律但商业化受限
预测结果:正确
拾象预测:o3在ARC-AGI与Frontier Math展现涌现式推理能力,定义强推理新标准;但强推理非大众刚需,当前ChatGPT中o1使用率不足5%,且高价(200–2000美元/月)制约普及。
2025实际:
- Reasoning Model与Deep Research成为Agent最快落地场景,但大众市场渗透率仍低;Gemini 3在Deep Think能力上媲美OpenAI,却未在Personalized助手场景达标;数据表现为工作日使用率高、周末显著下降;
- GPT-5等产品采用Model Router机制,在后台自动分发复杂Query至推理模型,用户无感使用强推理能力,加快商业化渗透。
11 Chatbot竞争翻篇,开启全新AI产品形态竞争
预测结果:正确
拾象预测:Chatbot竞争已于2024年终结;2025年比拼重心转向Computer Use、Coding Agent、Artifacts等更复杂、跨软件、更能捕获用户行为数据的新交互形态。
2025实际:
- Chatbot已成为类“浏览器”的基础设施入口;用户有强烈动机基于该入口执行复杂任务;AI产品形态正从“knowledge generation”向“task generation”迁移;
- AI浏览器、Artifacts、Browser Use、Canvas、语音等原生交互形态成为探索焦点;
- Google Notebook LM、Mix Board体现其多模态领先性;OpenAI Sora App虽留存一般,但仍是多模态智能与AI原生交互的重要实践。
12 Memory和Online learning问题在2025年得到解决,LLM更主动个性化
预测结果:错误
拾象预测:Memory与Continual Learning是AI Labs与Agent公司攻坚重点,2025年有望取得实质性方案,实现真正千人千面的主动个性化体验。
2025实际:
- Continual Learning仍是待解科学命题,需攻克灾难性遗忘、记忆存储结构、in-weights learning高效性、小样本Transfer Learning能力与Sample Efficiency等难题;
- 其突破非短期Milestone,而是基础架构变革与产品范式跃迁的前提;一旦解决,将开启“真正千人千面”的新纪元。
13 多模态智能取得突破,Visual Reasoning涌现
预测结果:正确
拾象预测:过去两年多模态进展滞后于语言模型,但2025年将迎密集投入;视觉推理与Scaling Law涌现成为关键方向;Google、Meta、Tesla等拥有海量视觉数据与完整infra的企业更具多模态研发优势。
2025实际:
- Sora与Veo已实现原生音画同步短视频生成,进入“可用”阶段;
- Google Nano Banana Pro展现突出逻辑与物理推理能力,而非仅图像生成;
- DeepMind Genie 3定位为通用World Model,可从文本生成可交互3D环境并维持数分钟一致性,支撑游戏开发与智能体训练。
14 ChatGPT与Perplexity等推广广告业务,广告收入超订阅
预测结果:部分验证
拾象预测:订阅模式ARPU过低(ChatGPT约8美元/年活用户),难支撑超级应用;广告才是主流商业化路径;Perplexity与OpenAI已启动广告试点,直连商品服务搜索,有望重组电商、视频、酒旅等供应链。
2025实际:
- 电商广告成ChatGPT除订阅外最大商业引擎;前Instacart CEO、Facebook高管Fidji Simo加盟后,OpenAI激进推进Instant Checkout、Shopping Research等功能;
- 市场担忧Google核心业务受冲击,但低估了广告算法基建、产品设计与客户拓展的实际难度;Google三十年构筑的广告护城河依然稳固。
15 自动驾驶到达商业化拐点:Waymo蚕食Uber份额,或于2025年IPO
预测结果:部分验证
拾象预测:Waymo 2024年底周付费出行达17.5万次;监管放松将加速其规模效应;IPO提上议程。
2025实际:
- Waymo现于美国5城运营约2,500辆robotaxi,截至2025年12月周付费行程超45万次,一年翻倍;
- Google Q2宣布追加50亿美元投资;在Tesla Robotaxi入局及监管不明朗背景下,IPO非当下优先级;Waymo数据对Google构建多模态智能与World Model具战略补充价值。
16 AI领域M&A活跃:AI应用、Coding领域出现大额收购,中小GPU云将整合
预测结果:部分验证
拾象预测:并购主体将从大厂收购Foundation Model公司转向中大型公司收购AI Native应用;驱动因素包括:GPU云价格战加剧、Vertical SaaS买断逻辑在Vertical AI重演、AI搜索/Coding/视频生成主线赛道并购、初创企业技术栈补强型收购。
2025实际:
- M&A活跃:Meta收购Scale AI,Wix收购base44;OpenAI收购Context.ai、Crossing Minds、Roi及Alex等;
- Acqui-hire成主流趋势,如Google“截胡”Winsurf,本质是高额技术许可+核心团队聘用;主因是AI军备竞赛升级与顶尖人才稀缺;
- Neo-cloud整合未发生:中小云融资与杠杆集中于GPU采购,AI需求暴增推高其业务增长,尚处扩张期而非整合期。
17 能源紧张持续,核电重启潮兴起,有望诞生10倍成长股
预测结果:正确
拾象预测:全球数据中心功耗爆炸式增长致电力短缺加剧;核电是唯一可靠24/7基荷电源;原料短缺与地缘扰动带来产业链资产稀缺性与价值重估。
2025实际:
- “有电”成比“有卡”更稀缺资产;拥有稳定基荷电力(Baseload Power)的公司获显著估值溢价;
- OpenAI、Google、Microsoft等纷纷签署核电采购协议;美股核电板块代表公司全年涨幅远超Nasdaq100,最高超出368个百分点。
18 AI+科研快速发展,各学科出现专属基础模型
预测结果:正确
拾象预测:生命科学、材料、气象、工业仿真等领域已涌现各自Foundation Model;AI4S无数据墙问题,可通过第一性原理模拟生成无限高质量合成数据,模型迭代极快。
2025实际:
- 高质量数据Scaling与Compute Scaling同步驱动AI4S进展;2025年多个跨模态、具影响力的Foundation Model发布。
19 AI技术红利大部分流入大公司,Mag 9强者恒强
预测结果:正确
拾象预测:Mag 9(Mag 7 + AVGO、TSMC)掌握云、算力、分发渠道等AI关键资产,任何AI价值交付均有其“收税”机会;随AI迈入Massive Adoption阶段,这些公司将持续收割AI富矿。
2025实际:
- 科技巨头从“收流量税”进化为“收基建税”;虽面临CapEx压力,但“在每一笔AI交易中抽成”的确定性使其成为AI红利最大捕获者;
- Mag 9内部出现分化,反映不同公司在AI价值链中的定位差异。
20 2025年Q1财报后美股下跌,但年末创历史新高
预测结果:部分验证
拾象预测:AI应用层Hype推高美股,但企业AI落地与盈利节奏可能不及预期,Q1或迎大幅回调;H2随Agent在Tool Use与长程任务上的进步,AI将重燃市场信心并创出新高。
2025实际:
- 美股科技板块于4月大幅回调(较2月高点跌近18.9%),主因宏观与政策扰动(如关税政策),而非AI业绩证伪;政府释放缓和信号后迅速反弹;
- AI叙事仍由算力与基建板块主导;AI应用板块虽叙事偏弱,企业采纳速度却加快——Salesforce AgentForce半年ARR从1亿增至5.4亿美元,其中半数交易来自新客户。

