阿里云近日在峰会上宣布实现“芯片 - 云 - 模型 - 推理”全栈 Agent 化升级,同步推出全新 AI 产品官网“千问云”、搭载自研 AI 芯片真武 M890 的超节点服务器,以及最新旗舰模型 Qwen3.7-Max。
 硬件基础设施升级
阿里云发布基于新一代 AI 芯片真武 M890 的磐久 AL128 超节点服务器,搭载自研互联芯片 ICN Switch 1.0。该服务器可将 128 张 AI 芯片组成一台计算机,P2P 时延低于 150ns,旨在解决 Agent 场景下的海量并发推理和大模型训练需求。
真武 M890 芯片详情
首次亮相的真武 M890 采用自研并行计算架构,内置 144GB 显存,性能是真武 810E 的 3 倍,片间互联带宽达到 800GB/s。芯片原生支持 FP32 到 FP4 等多种数据精度,覆盖高精度训练及低精度推理全场景,在低精度推理下可显著降低算力开销。
未来两年,平头哥将陆续推出算力更强的真武 V900、真武 J900 两代芯片。目前真武系列 AI 芯片累计出货 56 万片,已服务中国电信、中国一汽、浦发银行等 20 多个行业的 400 多家客户。
平头哥半导体副总裁高慧表示,Agentic 时代,Agent 执行任务时需毫秒级连续调用模型,要求 CPU、GPU、网络和存储紧密协同。平头哥构建全栈自研芯片矩阵,核心是实现算力、网力、存力的系统级协同,保障 Agent 流畅稳定运行。
 云产品 Agent 化改造
阿里云正将云产品本身转化为 Agent 可用资源,对云产品进行 Skill 化、MCP 化和 CLI 化改造,使每一个云产品都成为 Agent 可像调函数一样调用的标准化能力模块。
阿里云 CTO 李飞飞指出,传统云产品交互逻辑为人设计,而 Agent 工作负载具有无规律弹性、短生命周期及瞬时起量特征。阿里云为 Agent 构建了完整的运行环境支撑,提供轻量高效沙箱执行环境、多 Agent 协同能力、跨任务记忆能力、数据流转通路及全域智能运维能力。
 旗舰模型 Qwen3.7-Max
Qwen3.7-Max 是最新发布的旗舰大模型,在三方机构 Arena 全球大模型盲测总榜中位列国产模型第一,对标全球最强模型。
该模型面向 Agent 全新设计,在编程、推理等核心能力上持续突破,可胜任复杂编程、多智能体协作、生产级办公自动化等高难度任务。在训练时从未接触过的真武 M890 芯片上,Qwen3.7-Max 仅凭任务说明,从零开始自主工作 35 小时,独立完成了一个生产级 AI 计算内核的编写与调优,最终性能较官方版本提升 10 倍。
阿里巴巴通义大模型事业部负责人周靖人表示,大模型正经历从对齐人类偏好到对齐任务目标的范式转移。Qwen3.7-Max 的设计初衷是让模型成为 Agent 的智能内核,具备自主规划、持续迭代及跨工具协作能力。
百炼平台与生态
在百炼推理平台,阿里巴巴构建了大规模 GPU 资源集群,通过并池调度实现资源高效利用。百炼通过上下文缓存消除重复计算,借助吞吐弹性调度机制应对负载波动。在效果优化方面,引入 Agentic RL,基于 Agent 执行反馈的强化学习机制驱动模型持续迭代,并内建安全治理能力确保 Agent 自主运行不越界。
在生态策略上,百炼保持开放接入,除了阿里自研的千问模型矩阵,还将接入第三方模型。
千问云官网发布
峰会上,全新产品官网千问云(www.qianwenai.com)正式发布。打开官网页面,首页仅有一行 Agent 可读的 prompt 指令。
阿里云将所有模型服务的核心能力封装为标准化的 Skills 和 CLI 工具,智能体可直接解析指令,“学会”网站全部能力并根据需求自主调用。千问云提供 Qwen、GLM、Kimi、minimax、DeepSeek、Wan、HappyHorse 等 150 多款主流模型 API,让 Agent 工具高效地用模型和开发 AI 应用。
阿里云资深副总裁刘伟光表示,过去模型服务平台为人服务,未来用模型的主力将是 Agent,千问云正在全面重构模型服务平台,为开发者和 Agent 提供更友好的体验。
从底层芯片、Agentic Cloud、模型到推理平台全面升级,阿里云已完成全栈技术革新,为 Agentic 时代做好准备。

