近日,阿里云专有云团队联合通义实验室推出针对阿里云APG服务器的专属优化模型Qwen3-Pro:对比Qwen3-VL-235B(开源版)模型效果持平、性能翻倍:
Qwen3-Pro通过优化模型结构,在更低的激活参数下实现了模型效果对齐Qwen3-VL-235B。
具备优秀的文本理解和生成能力、深入的视觉感知和推理能力、扩展的上下文长度。
针对Qwen3-Pro模型结构,结合APG的硬件特性进行深入的算子优化、框架特性研发,在同等SLO服务等级目标下性能可达Qwen3-VL-235B的1.9倍。
可提供Instruct版本和增强推理的Thinking版本,以实现灵活的按需部署。
超强性能,单机推理吞吐性能翻倍
模型效果与Qwen3-VL-235B持平
-
通用能力:显著提升了指令执行、逻辑推理、文本理解、数学、科学、编码和工具使用。 -
增强的多模态推理:在STEM(科学、技术、工程、数学)领域表现卓越--擅长因果分析,提供逻辑严谨、基于证据的回答。 -
视觉代理:操作PC/移动GUI — 识别元素、理解功能、调用工具、完成任务。 -
长上下文和视频理解:原生256K上下文,可扩展到1M;处理书籍和长达数小时的视频,具有完整的回忆和秒级索引。 -
高级空间感知:判断物体位置、视角和遮挡;提供更强的2D定位并启用 3D定位,用于空间推理和具身AI。 -
高质量生成:在主观和开放式任务中更好地符合用户偏好,使响应更有帮助,生成的文本质量更高。
/ END /


