

AI下半场开启:从“预测下一个词”到“预测下一个状态”
在2026年国际消费电子展(CES)上,英伟达CEO黄仁勋提出:“物理AI的ChatGPT时刻”即将到来。这一判断与北京智源人工智能研究院发布的《2026人工智能十大趋势》高度契合——AI演进的核心正从语言模型的参数竞赛,转向对物理世界底层规律的理解与建模,行业技术范式迎来系统性重塑。
智源研究院院长王仲远指出:“基础模型的竞争焦点,已从‘参数有多大’转变为‘能否理解世界如何运转’。我们正从‘预测下一个词’跨越到‘预测世界的下一个状态’(Next-State Prediction, NSP)。”
NSP机制标志着AI能力的结构性跃迁:不再停留于感知数字信息,而是建模时空连续性与因果关系,支撑自动驾驶仿真、具身智能决策等物理世界任务。
在该趋势报告中,蚂蚁集团作为关键产业实践代表被多次提及,其在大模型、超级应用、AI安全等维度的系统性布局,为行业提供了可验证的“实践答卷”。
范式跃迁:AI从“数字感知”迈向“物理理解”
报告指出,2026年是AI从数字世界迈入物理世界、从技术演示走向规模价值的关键分水岭。驱动这一跃迁的三条主线为:
认知方式变革:从静态识别到动态预判
AI正从识别图像、文本等静态内容,转向预测物体运动轨迹、行为演化路径等动态过程。以世界模型与NSP为代表的新方向,赋予AI在机器人控制、工业仿真等场景中的“预判力”。
形态变革:从代码到实体,从单体到协同
AI正由软件走向具身化——通用人形机器人加速进入工业现场;多智能体系统(MAS)通过标准化通信协议(如MCP、A2A),实现跨角色分工协作,支撑科研、制造等复杂工作流。
价值创造方式变革:从概念验证到商业闭环
消费端,“All in One”超级应用成为巨头竞争焦点;企业端,AI越过早期“幻灭期”,依托数据治理与行业接口标准,在垂直领域孵化出可衡量商业价值的MVP产品。
技术前沿:四大支点重塑AI基础能力
趋势1:世界模型成为AGI共识方向,NSP或成新范式
行业共识正从纯语言模型转向能融合视觉、物理规则的多模态世界模型。NSP标志着AI具备时空连续性建模与因果推理能力,是迈向认知智能的关键一步。
趋势2:具身智能迎来产业“出清”,加速落地工业场景
随着大模型与运动控制、合成数据深度融合,人形机器人将于2026年突破Demo阶段,进入真实产线部署与服务场景。
趋势3:多智能体系统决定应用上限,“Agent时代的TCP/IP”初具雏形
MCP、A2A等通信协议趋于标准化,使智能体间形成通用“语言”。多智能体协同将成为科研攻关、工业调度等复杂任务的关键基础设施。
趋势4:AI Scientist成为AI for Science(AI4S)北极星,国产科学基础模型加速孕育
AI正从科研辅助工具升级为自主设计实验、分析数据、提出假说的“AI科学家”。构建自主可控的科学基础模型体系,已成为国家战略重点。
产业落地:蚂蚁“超级应用+垂直闭环”的双轨验证
趋势5:AI时代的新BAT格局趋于明确,垂直赛道仍存高价值空间
C端超级应用竞争白热化:海外以ChatGPT、Gemini为标杆;国内字节、阿里、蚂蚁依托生态积极布局。“灵光”与“阿福”是蚂蚁并行推进的两大代表性产品。
全模态AI助手“灵光”,聚焦解决AI应用“重聊天、轻行动”痛点。上线首周下载量超200万,“闪应用”功能支持用户用自然语言即时生成可交互轻应用,降低开发门槛,推动“全民手搓AI应用”。其全模态生成能力提升交互效率与信息呈现质量。
垂类健康助手“阿福”,定位“AI健康朋友”,当前月活用户超3000万,单日健康问答量破1000万。其自研医疗专用大模型,联合全国院士、名医深度共创,接入超5000家医院、50万真人医生及500位名医AI分身,实现从专业问答到医疗服务的闭环。
“灵光”与“阿福”共同印证AI价值兑现的两条路径:一是打造普适性超级入口,二是深耕垂直领域构建专业壁垒与服务纵深。
趋势6:产业应用滑向“幻灭低谷期”,2026年下半年迎“V型”反转
企业级AI应用在经历概念验证热潮后,受制于数据质量、部署成本等问题,正步入调整期。但随数据治理能力增强与工具链成熟,预计2026年下半年将出现拐点,一批可量化ROI的MVP将在金融、制造、医疗等行业规模化落地。
关键支撑:蚂蚁在推理与安全上的系统性构筑
趋势7:合成数据占比攀升,有望破除“2026年数据枯竭魔咒”
高质量真实数据日益稀缺,合成数据正成为核心训练燃料。尤其在自动驾驶与机器人领域,由世界模型生成的合成数据,显著降低训练成本、提升泛化性能。
趋势8:推理优化远未触顶,“技术泡沫”是伪命题
推理效率仍是AI规模化落地的核心瓶颈。算法创新与硬件协同持续压降推理成本、提升能效比,为边缘端部署高性能模型提供支撑。
蚂蚁百灵大模型体系涵盖Ling(语言)、Ring(思考)、Ming(多模态)三大系列。其中Ling系列采用高稀疏MoE架构,基于二十万亿Tokens语料训练,已推出万亿参数模型Ling-1T与Ring-1T。其首创“棒冰算法(icepop)”显著提升模型稳定性,Ling-1T曾长期位居Hugging Face总榜首位。
蚂蚁百灵大模型负责人张志强指出:“‘灵光闪应用’30秒生成体验的背后,是推理效率的持续进化。注意力机制线性化、长上下文优化等长期工程投入,构成了Agent能力跃迁的底层基石。”
趋势9:开源编译器生态汇聚众智,异构全栈底座引领算力普惠
为应对算力垄断风险,兼容异构芯片的软件栈建设加速。算子语言日趋统一,编译器技术收敛,正降低AI开发门槛。智源FlagOS等平台致力于构建软硬解耦、开放普惠的AI算力底座。
趋势10:AI安全迈向机制可解释与自演化攻防
AI安全风险已从表层“幻觉”升维至深层“系统性欺骗”。技术侧,回路追踪等可解释研究持续推进;产业侧,智源联合全球学者发布AI欺骗国际报告,警示前沿风险。
蚂蚁构建覆盖线上与终端的立体安全防线:
- 线上侧:“蚁天鉴”升级为面向智能体时代的全流程安全解决方案,基于“对齐-扫描-防御”技术栈,践行“以攻促防”理念;
- 终端侧:面向AI眼镜等新一代设备,发布全球首个智能终端可信连接框架gPass,集成安全、交互、互连三大能力,打通用户-设备-模型-服务全链路,为个人智能体时代构建可信数字服务生态。
结语:AI下半场已然到来
智源十大趋势清晰指向一个共识:AI正进入下半场。
一方面,世界模型、NSP、具身智能、多智能体系统与AI Scientist,正在重构AI理解世界、执行动作与协同决策的底层机制;另一方面,超级应用、垂直闭环、高效推理、安全架构与异构算力底座,则决定这些能力能否真正嵌入组织、服务终端、扎根产业。
当AI不仅能“看懂世界”,更能被系统性地部署于App、机器人、眼镜、工厂与医院,这场从数字世界迈向物理世界的跃迁,便已不可逆转地进入深水区。


