
3 月 4 日讯,开源社区 Hugging Face 最新榜单显示,开源仅 6 天的阿里万相大模型强势反超 DeepSeek-R1,登顶模型热榜、模型空间榜两大榜单,一跃成为近期全球开源社区最炙手可热的大模型。这一成绩的取得,彰显了阿里在大模型技术领域的深厚底蕴与创新实力,也为全球开源社区注入了新的活力。

根据最新数据,万相 2.1(Wan2.1)在 Hugging Face 及魔搭社区的总下载量已超百万,在 Github 的 Star 数超 6k。如此惊人的下载量和关注度,足以证明其在全球开发者和用户心中的受欢迎程度。万相 2.1 作为阿里云视觉生成基座模型的最新版本,主打视频生成和多模态 AI 能力,堪称大模型领域的 “全能选手”。自 2 月 26 日宣布开源以来,凭借强大的性能和出色的易用性迅速走红全球。它不仅支持文生视频、图生视频、视频编辑等多项任务,还能在消费级 GPU 上流畅运行,甚至能够生成中英文文字特效,这在开源模型中尚属首次。其 14b 版本兼具开源免费、高性能的优点,备受好评,大量网友在 X(Twitter)、reddit 等社交平台称赞模型生成的效果;而 1.3b 版支持本地部署同样惊艳,有网友表示其生成效果甚至超越了部分更大尺寸的视频生成模型。
在技术实力方面,万相大模型表现卓越。在权威评测集 VBench 中,万相 2.1 以总分 86.22% 的成绩大幅超越 Sora、Luma、Pika 等国内外模型,稳居榜首位置。无论是复杂运动表现、物理规律遵循,还是艺术表现力,万相 2.1 都展现出了 “天花板级” 的实力。历经一年多的进化,尽管大部分视频生成模型已经有了长足的进步,但面对旋转、跳跃、奔跑等复杂动作时仍会时不时 “翻车”。而万相在这方面下了狠功夫,如今它能够在多种场景下实现稳定的复杂运动生成,甚至还通过了部分视频生成中的图灵测试。例如,让它生成一段男生在篮球场上投篮的画面,球员弹跳、投篮的动作行云流水,篮球的运动轨迹也符合现实场景。再如,脸上涂满厚厚油彩的小丑,叼着一根雪茄,迈着六亲不认的步伐,手部的摆动、眼神的变化都相当逼真,极具电影质感。

除了强大的模型性能,阿里万相团队在生态建设方面也持续发力。过去几天,团队进一步扩大生态兼容,新增支持了 ComfyUI、Diffusers 等主流框架,让更多用户能便捷地体验模型的能力。万相团队表示,未来还将为用户开放更多体验形式,不断拓展模型的应用场景和边界。
阿里云方面表示,从 2023 年开始就坚定大模型开源路线,目前其千问(Qwen)和万相(Wan)两大基座模型均已完成开源,实现了全模态、全尺寸大模型的开源。这种开放的态度和积极的行动,吸引了大量开发者参与到万相模型的生态建设中来,进一步推动了技术的创新与发展。

万相大模型的成功登顶,不仅是阿里技术实力的体现,也为全球开源社区带来了新的发展机遇。它为影视创作、广告设计等多个领域提供了强大的创作工具,有望推动相关产业的创新与升级。在影视创作领域,导演和编剧们可以利用万相 2.1 快速生成各种创意视频,为作品增添更多精彩元素;在广告设计行业,设计师们能借助它高效地制作出吸引人的广告视频,提升广告效果。而且,随着万相 2.1 在全球的广泛应用,还可能带动相关产业链的发展,比如硬件设备、数据标注等产业,为经济增长注入新的活力。相信在未来,阿里万相大模型将在全球开源社区持续发光发热,为 AI 技术的发展贡献更多力量。
福利一:年卡会员特惠来袭,365 元畅享整年知识福利,赠价值 1000 元的 AI 人工智能通识 3 天线下培训,专业讲师助您入门前沿技术。
福利二:4980 元拿下工信部 AIGC 专业级资格证,含 120 节精研课程包,覆盖知识要点,另赠千元 3 天线下培训,线上线下结合,助您抢占职业先机。
别犹豫啦,速来开启人工智能学习之旅!
培训地点 :
山西省运城市好课堂乐学广场4楼路演大厅
咨询电话:
4001188556/17703590976




END








