阿里除夕开源“王炸”千问 3.5-Plus ，性能媲美Gemini 3 Pro、Claude 4.5 Opus，百万 Token 8毛钱- 大数跨境

阿里除夕开源“王炸”千问 3.5-Plus ，性能媲美Gemini 3 Pro、Claude 4.5 Opus，百万 Token 8毛钱

AI前线

2026-02-16

导读：除夕当天，阿里巴巴低调但密集地抛出了一枚重磅“技术炸弹”——全新一代大模型 Qwen 3.5

除夕当天，阿里巴巴低调发布全新一代大模型 Qwen 3.5-Plus，并正式开源。该模型性能对标 Gemini 3 Pro，在多项基准测试中实现超越，同时 API 成本低至每百万 Token 0.8 元人民币，仅为 Gemini 3 Pro 的 1/18，精准击中当前大模型“性能趋同、成本博弈”的行业痛点。

底层架构全面革新，实现“以小胜大”

Qwen 3.5-Plus 并非参数规模的线性升级，而是一次底层架构的彻底重构。其总参数达 3970 亿，但单次激活参数仅 170 亿，通过混合注意力机制与稀疏 MoE 架构设计，显著提升推理效率。

相比前代，千问 3.5 在视觉与文本混合 token 上预训练，大幅增强中英文、多语言、STEM 及推理能力。在不到 40% 参数量下，性能媲美超万亿参数的 Qwen3-Max，显存占用降低约 60%，最大推理吞吐量提升至 19 倍。

支持更高并发请求
可承载复杂 Agent 任务
显著降低调用成本

在多个高难度评测中表现进入第一梯队：

MMLU-Pro 知识推理：87.8 分，超越 GPT-5.2
GPQA 博士级难题：88.4 分，高于 Claude 4.5
IFBench 指令遵循：76.5 分，刷新纪录
通用 Agent（BFCL-V4）、搜索 Agent（BrowseComp）整体表现优于 Gemini 3 Pro 与 GPT-5.2

图说：阿里开源千问 Qwen3.5-Plus，性能媲美 Gemini 3 Pro

原生多模态能力全面跃升

千问 3.5 实现原生多模态训练，在 MathVision、RealWorldQA、CC_OCR、RefCOCO-avg、MLVU 等权威评测中均取得最佳成绩。

在学科解题、任务规划与空间推理方面表现优于专用模型 Qwen3-VL，空间定位与带图推理能力显著增强。支持长达 2 小时（1M token）视频输入，适用于长视频分析与摘要生成。

更融合视觉理解与代码能力，可通过手绘草图生成前端代码，或通过截图定位并修复 UI 问题，推动视觉编程落地为实际生产力工具。

技术突破：高效训练与架构创新

Qwen 3.5 融合自研门控技术（曾获 NeurIPS 2025 最佳论文），结合线性注意力与稀疏 MoE 架构，实现极致模型效率。

在预训练阶段聚焦三大维度：

能力（Power）

基于更大规模图文语料训练，强化中英文、多语言、STEM 与推理数据，经严格过滤后，Qwen3.5-397B-A17B 性能与超万亿参数的 Qwen3-Max-Base 相当。

效率（Efficiency）

采用 Qwen3-Next 架构，引入更高稀疏度 MoE、Gated DeltaNet + Gated Attention 混合注意力、稳定性优化及多 token 预测。在 32K 上下文下解码吞吐量提升 8.6 倍，256K 下提升至 19 倍。

通用性（Versatility）

早期融合文本与视觉信息，扩展 STEM 与视频数据，原生支持多模态。语言覆盖从 119 种增至 201 种，词表由 15 万扩至 25 万，小语种编码/解码效率最高提升 60%。

图说：千问 3.5 推理效率大幅提升，最大吞吐量提升至 19 倍

训练过程中采用 FP8 与 FP32 混合精度策略，在数十万亿 Token 规模下，激活内存减少约 50%，训练速度提升约 10%，有效控制算力消耗与训练成本。

强化学习驱动 Agent 能力进化

依托增强的视觉理解与操作执行能力，Qwen 3.5 可在手机和 PC 环境中完成日常任务。移动端支持主流应用指令，PC 端可处理跨应用数据整理与自动化流程。

团队构建可扩展异步强化学习框架，端到端训练加速 3–5 倍，支持插件式智能体扩展，规模可达百万级。

持续领跑开源生态

自 2023 年开源以来，阿里已累计发布超 400 个千问系列模型，涵盖多种参数规模与模态类型。全球累计下载量突破 10 亿次，单月下载量超过 DeepSeek、Meta、OpenAI、智谱、Kimi、MiniMax 等总和，衍生模型超 20 万个。

目前，千问 APP 与 PC 端已接入 Qwen 3.5-Plus。开发者可通过魔搭社区、HuggingFace 下载模型，或通过阿里云百炼获取 API 服务。后续将陆续开源更多尺寸与功能的 Qwen 3.5 系列模型，旗舰版 Qwen3.5-Max 也将发布。

海外社区热议：迈向“可执行智能体”

Qwen 3.5 Plus 发布后引发海外技术圈广泛讨论。有用户指出其在 UI 设计能力上表现突出，能高质量生成界面布局与交互逻辑，对低代码开发具有实用价值。

另有反馈强调其多语言支持能力，模型已能自然表达多种小语种，使语言覆盖从参数指标转化为真实体验。

更有评论认为，此次发布标志着“Agent AI”竞争升温。阿里巴巴的目标不仅是提升对话能力，更是让模型具备真实环境中的行动力，“会说话也会做事”正成为新一代 AI 的核心方向。

综合来看，Qwen 3.5 Plus 不仅是性能升级，更被视为向“可执行智能体”迈进的关键一步。

声明：本文为 AI 前线整理，不代表平台观点，未经许可禁止转载。

【声明】内容源于网络

AI前线

面向AI爱好者、开发者和科学家，提供大模型最新资讯、AI技术分享干货、一线业界实践案例，助你全面拥抱AIGC。

内容 8161

粉丝 0

AI前线面向AI爱好者、开发者和科学家，提供大模型最新资讯、AI技术分享干货、一线业界实践案例，助你全面拥抱AIGC。

总阅读96.3k

粉丝0

内容8.2k