大数跨境
0
0

Qwen3-Pro重磅发布!基于阿里云APG服务器的专属优化模型,性能翻倍

Qwen3-Pro重磅发布!基于阿里云APG服务器的专属优化模型,性能翻倍 阿里云政企
2025-11-28
17
导读:超强性能

图片

近日,阿里云专有云团队联合通义实验室推出针对阿里云APG服务器的专属优化模型Qwen3-Pro:对比Qwen3-VL-235B(开源版)模型效果持平、性能翻倍:

  • Qwen3-Pro通过优化模型结构,在更低的激活参数下实现了模型效果对齐Qwen3-VL-235B

  • 具备优秀的文本理解和生成能力、深入的视觉感知和推理能力、扩展的上下文长度。

  • 针对Qwen3-Pro模型结构,结合APG的硬件特性进行深入的算子优化、框架特性研发,在同等SLO服务等级目标下性能可达Qwen3-VL-235B的1.9倍

  • 可提供Instruct版本和增强推理的Thinking版本,以实现灵活的按需部署。



超强性能,单机推理吞吐性能翻倍







模型效果与Qwen3-VL-235B持平

  • 通用能力:显著提升了指令执行、逻辑推理、文本理解、数学、科学、编码和工具使用。
  • 增强的多模态推理:在STEM(科学、技术、工程、数学)领域表现卓越--擅长因果分析,提供逻辑严谨、基于证据的回答。
  • 视觉代理:操作PC/移动GUI — 识别元素、理解功能、调用工具、完成任务。
  • 长上下文和视频理解:原生256K上下文,可扩展到1M;处理书籍和长达数小时的视频,具有完整的回忆和秒级索引。
  • 高级空间感知:判断物体位置、视角和遮挡;提供更强的2D定位并启用 3D定位,用于空间推理和具身AI。
  • 高质量生成:在主观和开放式任务中更好地符合用户偏好,使响应更有帮助,生成的文本质量更高。






 模型输出说明 
推理模型:Qwen3-Pro-Instruct&Qwen3-Pro-Thinking
训练模型:Qwen3-Pro-Base


/ END /



【声明】内容源于网络
0
0
阿里云政企
阿里云政企官方公众号
内容 130
粉丝 0
阿里云政企 阿里云政企官方公众号
总阅读132
粉丝0
内容130