分享
阿里推出新一代开源通义千问模型 Qwen3
2025-04-29 10:42 星期二
4月29日凌晨,阿里巴巴发布了新一代通义千问模型Qwen3(简称千问3)。这款模型的参数量只有DeepSeek-R1的三分之一,大幅降低了运行成本。千问3是一种“混合推理模型”,它将快速响应和深度分析功能集成在一个模型中。对于简单问题,它可以迅速给出答案;而对于复杂问题,则可以通过多步骤进行深入分析,同时减少对算力的消耗。
千问3的总参数量为2350亿,但实际激活时只需占用22亿参数。据阿里介绍,仅需4张H20显卡即可部署完整的千问3模型,其显存占用仅为同类性能模型的三分之一。
千问3提供了多种版本选择,包括两款参数量为300亿和2350亿的MoE模型,以及6款密集模型,参数量分别为0.6亿、1.7亿、4亿、8亿、14亿和32亿。通过API接口,用户可以灵活设置“思考预算”(即最大分析深度对应的token数量),从而实现不同程度的推理能力,满足不同场景下对性能和成本的需求。例如,4亿参数的模型适合手机端使用,而8亿参数的版本则可用于电脑和车载设备等。
新闻推荐
查看更多
大数新闻社群
7x24h跨境新闻推送
加入卖家交流群


