大数跨境

5 秒视频背后的野心:Midjourney V1 迈向 “实时开放世界模拟”

5 秒视频背后的野心:Midjourney V1 迈向 “实时开放世界模拟” 元龙数字智能科技
2025-06-19
2

5 秒视频

背后的野心

Midjourney V1 迈向 “实时开放世界模拟”

在当今科技飞速发展的时代,人工智能技术的应用领域不断拓展,为各个行业带来了前所未有的变革。6 月 19 日,据 TechCrunch 报道,AI 图像生成领域的佼佼者 Midjourney 宣布推出其首款 AI 视频生成模型 V1,这一消息犹如一颗重磅炸弹,瞬间在科技圈和创意产业中引发了广泛关注。

Midjourney 作为一家专注于 AI 图像生成的初创公司,凭借其先进的技术和出色的图像生成效果,已经在市场上积累了大量的用户和良好的口碑。其此前推出的图像生成模型,能够根据用户输入的简单文本描述,生成高质量、富有创意的图像,为设计师、艺术家、广告从业者等提供了强大的创作工具,极大地提高了创作效率,降低了创作门槛。

此次推出的 V1 视频生成模型,更是将 Midjourney 的业务范围拓展到了视频领域。该模型允许用户上传一张图片,或者使用 Midjourney 其他模型生成的图像作为基础,进而生成长达 5 秒的视频。这一功能的实现,为用户提供了一种全新的创作体验,让静态的图像 “动” 了起来,为创意表达增添了更多的可能性。例如,一位设计师原本使用 Midjourney 生成了一张精美的产品概念图,现在通过 V1 模型,他可以将这张图转化为一段简短的动态展示视频,更生动地呈现产品的特点和使用场景,无论是用于产品推广还是向客户展示创意,都能起到更好的效果。

V1 的发布,也让 Midjourney 正式加入了与 OpenAISora、Runway 的 Gen 4 等 AI 视频模型的激烈竞争之中。在这个充满挑战与机遇的 AI 视频领域,各大公司纷纷投入资源,致力于研发更先进、更智能的视频生成技术。OpenAI 的 Sora 凭借其在人工智能领域的深厚技术积累和广泛的用户基础,在视频生成方面具有独特的优势;Runway 的 Gen 4 则以其多样化的功能和灵活的应用场景,受到了不少用户的青睐。Midjourney 的 V1 模型要在这样竞争激烈的环境中脱颖而出,并非易事。然而,Midjourney 也有着自己的核心竞争力。其在图像生成领域积累的丰富经验和先进技术,能够为 V1 模型提供有力的支持,使得生成的视频在画面质量、风格一致性等方面表现出色。而且,Midjourney 一直以来注重用户体验,其简洁易用的操作界面和良好的社区氛围,也有助于吸引更多用户选择 V1 模型。

Midjourney 公司的 CEO David Holz 表示,推出 AI 视频模型 V1 并非仅仅为了满足好莱坞电影制作或广告业的素材生成需求。在他看来,这是公司迈向 “实时开放世界模拟” AI 模型这一终极目标的重要一步。所谓 “实时开放世界模拟”,意味着 AI 模型能够根据各种复杂的输入和实时变化的环境,生成高度逼真、动态且具有交互性的虚拟场景。这一目标的实现,将对多个领域产生深远的影响。在游戏行业,玩家将能够体验到更加真实、沉浸式的游戏世界,游戏中的环境和角色能够根据玩家的操作实时做出反应;在影视制作中,导演可以更轻松地创建各种奇幻、宏大的虚拟场景,无需耗费大量的时间和资金进行实地拍摄和后期特效制作;在教育领域,学生可以通过虚拟现实技术,身临其境地感受历史事件、自然现象等,提高学习的趣味性和效果。为了实现这一宏伟目标,Midjourney 已经制定了详细的技术发展规划。在推出 V1 视频模型之后,公司计划进一步开发用于生成 3D 渲染的 AI 模型。3D 渲染技术在建筑设计、工业制造、影视动画等众多领域都有着广泛的应用,通过 AI 技术实现高效、高质量的 3D 渲染,将大大提高这些行业的生产效率和创新能力。例如,建筑设计师可以利用 AI 3D 渲染模型,快速生成不同风格、不同结构的建筑设计方案,并通过虚拟漫游的方式,直观地感受设计效果,及时进行调整和优化。此外,Midjourney 还将致力于研发实时 AI 模型,使 AI 能够在瞬间对各种输入做出响应,生成相应的内容,进一步提升 AI 的智能化和实用性。

目前,V1 模型仅通过 Discord 平台的网页端提供服务。Discord 作为一款广受欢迎的社交聊天平台,拥有庞大的用户群体,尤其在游戏玩家、创意工作者等群体中具有极高的人气。Midjourney 选择在 Discord 平台上推出 V1 模型,一方面可以借助 Discord 的用户基础,快速扩大 V1 模型的影响力和用户覆盖面;另一方面,Discord 良好的社交互动功能,也能够促进用户之间的交流和分享,形成一个活跃的创作社区。用户可以在 Discord 上方便地交流使用 V1 模型的经验、创意和技巧,互相启发,共同推动 AI 视频创作的发展。在收费方面,Midjourney 采用了与图像生成不同的策略。视频生成的收费是典型图像生成的 8 倍,这意味着用户在创建视频时会比创建图像更快地耗尽每月的生成配额。对于想要尝试 V1 模型的用户来说,最低成本的方式是订阅 Midjourney 每月 10 美元的基础套餐。而订阅每月 60 美元的专业套餐和每月 120 美元的超级套餐的用户,在公司的 “放松” 模式下将享有无限的视频生成服务。不过,Midjourney 也表示,在未来一个月内,将重新评估其视频模型的定价策略,以更好地适应市场需求和用户反馈。

从功能设置来看,V1 为用户提供了多种自定义选项,以满足不同用户的创作需求。用户可以选择自动动画设置,让图像按照预设的规则随机移动,轻松生成具有动态效果的视频;也可以选择手动设置,通过输入详细的文本描述,精确地指定想要添加到视频中的特定动画效果。比如,用户想要制作一个关于花朵绽放的视频,在手动设置模式下,他可以详细描述花朵从含苞待放到完全盛开的每一个动作细节,V1 模型会根据这些描述生成相应的动画。此外,用户还能通过在设置中选择 “低运动” 或 “高运动” 来灵活调整相机和主体的运动量。如果用户想要制作一个节奏舒缓、画面平稳的视频,就可以选择 “低运动” 模式;而如果想要制作一个充满冲击力、动感十足的视频,则可以选择 “高运动” 模式。

尽管目前 V1 生成的视频默认时长只有 5 秒,但考虑到用户可能有更长视频的创作需求,Midjourney 为用户提供了视频延长功能。用户可以选择将视频延长 4 秒,并且最多可延长四次,这就意味着 V1 视频的最长时长可达 21 秒。这一设计在一定程度上兼顾了用户的多样化需求和模型的性能限制。随着技术的不断发展和优化,未来 V1 模型在视频时长方面可能还会有更大的突破。

从已经展示的 V1 视频效果来看,其延续了 Midjourney 图像模型一贯的超现实美感风格。生成的视频画面精美,色彩鲜艳,充满了奇幻和想象的元素,给人带来强烈的视觉冲击。然而,与市场上已经推出数月甚至数年的领先 AI 视频模型相比,V1 的综合表现究竟如何,还需要在实际应用中进一步验证。在视频的流畅度、细节处理、逻辑连贯性等方面,V1 可能还面临着一些挑战。例如,在一些复杂场景的视频生成中,可能会出现物体运动不自然、画面闪烁等问题。但作为 Midjourney 进军视频领域的首款产品,V1 已经展现出了巨大的潜力和创新之处。相信随着技术的不断迭代和优化,V1 模型将在未来的 AI 视频市场中占据一席之地。

Midjourney 推出首款 AI 视频生成模型 V1,无疑为 AI 视频领域注入了新的活力。它不仅为用户提供了全新的创作工具和体验,也推动了整个行业的技术进步和创新发展。在未来,我们有理由期待 Midjourney 在 AI 视频领域带来更多的惊喜,为我们创造出更加精彩、富有创意的视觉内容。同时,随着 AI 视频技术的不断成熟和普及,它也将深刻改变我们的生活、工作和娱乐方式,让我们拭目以待。


END

【声明】内容源于网络
0
0
元龙数字智能科技
永做第一 使命第一 向善第一
内容 901
粉丝 0
元龙数字智能科技 永做第一 使命第一 向善第一
总阅读2.0k
粉丝0
内容901