除夕当天,阿里巴巴低调发布全新一代大模型 Qwen 3.5-Plus,并正式开源。该模型性能对标 Gemini 3 Pro,在多项基准测试中实现超越,同时 API 成本低至每百万 Token 0.8 元人民币,仅为 Gemini 3 Pro 的 1/18,精准击中当前大模型“性能趋同、成本博弈”的行业痛点。
底层架构全面革新,实现“以小胜大”
Qwen 3.5-Plus 并非参数规模的线性升级,而是一次底层架构的彻底重构。其总参数达 3970 亿,但单次激活参数仅 170 亿,通过混合注意力机制与稀疏 MoE 架构设计,显著提升推理效率。
相比前代,千问 3.5 在视觉与文本混合 token 上预训练,大幅增强中英文、多语言、STEM 及推理能力。在不到 40% 参数量下,性能媲美超万亿参数的 Qwen3-Max,显存占用降低约 60%,最大推理吞吐量提升至 19 倍。
- 支持更高并发请求
- 可承载复杂 Agent 任务
- 显著降低调用成本
在多个高难度评测中表现进入第一梯队:
- MMLU-Pro 知识推理:87.8 分,超越 GPT-5.2
- GPQA 博士级难题:88.4 分,高于 Claude 4.5
- IFBench 指令遵循:76.5 分,刷新纪录
- 通用 Agent(BFCL-V4)、搜索 Agent(BrowseComp)整体表现优于 Gemini 3 Pro 与 GPT-5.2
图说:阿里开源千问 Qwen3.5-Plus,性能媲美 Gemini 3 Pro
原生多模态能力全面跃升
千问 3.5 实现原生多模态训练,在 MathVision、RealWorldQA、CC_OCR、RefCOCO-avg、MLVU 等权威评测中均取得最佳成绩。
在学科解题、任务规划与空间推理方面表现优于专用模型 Qwen3-VL,空间定位与带图推理能力显著增强。支持长达 2 小时(1M token)视频输入,适用于长视频分析与摘要生成。
更融合视觉理解与代码能力,可通过手绘草图生成前端代码,或通过截图定位并修复 UI 问题,推动视觉编程落地为实际生产力工具。
技术突破:高效训练与架构创新
Qwen 3.5 融合自研门控技术(曾获 NeurIPS 2025 最佳论文),结合线性注意力与稀疏 MoE 架构,实现极致模型效率。
在预训练阶段聚焦三大维度:
能力(Power)
基于更大规模图文语料训练,强化中英文、多语言、STEM 与推理数据,经严格过滤后,Qwen3.5-397B-A17B 性能与超万亿参数的 Qwen3-Max-Base 相当。
效率(Efficiency)
采用 Qwen3-Next 架构,引入更高稀疏度 MoE、Gated DeltaNet + Gated Attention 混合注意力、稳定性优化及多 token 预测。在 32K 上下文下解码吞吐量提升 8.6 倍,256K 下提升至 19 倍。
通用性(Versatility)
早期融合文本与视觉信息,扩展 STEM 与视频数据,原生支持多模态。语言覆盖从 119 种增至 201 种,词表由 15 万扩至 25 万,小语种编码/解码效率最高提升 60%。
图说:千问 3.5 推理效率大幅提升,最大吞吐量提升至 19 倍
训练过程中采用 FP8 与 FP32 混合精度策略,在数十万亿 Token 规模下,激活内存减少约 50%,训练速度提升约 10%,有效控制算力消耗与训练成本。
强化学习驱动 Agent 能力进化
依托增强的视觉理解与操作执行能力,Qwen 3.5 可在手机和 PC 环境中完成日常任务。移动端支持主流应用指令,PC 端可处理跨应用数据整理与自动化流程。
团队构建可扩展异步强化学习框架,端到端训练加速 3–5 倍,支持插件式智能体扩展,规模可达百万级。
持续领跑开源生态
自 2023 年开源以来,阿里已累计发布超 400 个千问系列模型,涵盖多种参数规模与模态类型。全球累计下载量突破 10 亿次,单月下载量超过 DeepSeek、Meta、OpenAI、智谱、Kimi、MiniMax 等总和,衍生模型超 20 万个。
目前,千问 APP 与 PC 端已接入 Qwen 3.5-Plus。开发者可通过魔搭社区、HuggingFace 下载模型,或通过阿里云百炼获取 API 服务。后续将陆续开源更多尺寸与功能的 Qwen 3.5 系列模型,旗舰版 Qwen3.5-Max 也将发布。
海外社区热议:迈向“可执行智能体”
Qwen 3.5 Plus 发布后引发海外技术圈广泛讨论。有用户指出其在 UI 设计能力上表现突出,能高质量生成界面布局与交互逻辑,对低代码开发具有实用价值。
另有反馈强调其多语言支持能力,模型已能自然表达多种小语种,使语言覆盖从参数指标转化为真实体验。
更有评论认为,此次发布标志着“Agent AI”竞争升温。阿里巴巴的目标不仅是提升对话能力,更是让模型具备真实环境中的行动力,“会说话也会做事”正成为新一代 AI 的核心方向。
综合来看,Qwen 3.5 Plus 不仅是性能升级,更被视为向“可执行智能体”迈进的关键一步。
声明:本文为 AI 前线整理,不代表平台观点,未经许可禁止转载。

