

使用 MiniMax Agent 生成连续动画视频

路上侠客

2025-06-22

导读：传统的连续动画视频制作方式，一般是通过即梦等工具生成分镜图，然后基于分镜图生成单个分镜视频，最后再通过剪映等剪

传统的连续动画视频制作方式，一般是通过即梦等工具生成分镜图，然后基于分镜图生成单个分镜视频，最后再通过剪映等剪辑软件将多个分镜视频合成为一个完整的动画。这个过程相对繁琐。

今天，我们将尝试使用强大的 MiniMax Agent 来直接生成动画视频。目前，MiniMax Agent 是完全免费开放使用的。

操作流程

我们将预先准备好的五个分镜视频片段上传到 MiniMax Agent 平台，然后输入以下提示词：

“附件是五个端午节划龙舟场景视频动画，请按场景顺序整合成一个完整的视频。”

Agent 接收任务后，会开始处理。任务完成后，会提示已完成。

Agent 执行过程

我们可以查看 Agent 的执行过程，了解它是如何理解任务、调用工具并完成视频合成的。

（注：此处的执行过程截图展示了 Agent 对任务的理解、规划和工具调用，例如调用 `minimax_minimax` 的 `generate_video` 功能。）

成果下载与预览

在 Minimax Agent 的工作视窗中，可以将合成好的视频下载到本地。

预览生成的视频截图，可以看到 Agent 成功将多个分镜合成为一个约 25 秒的完整视频。

补充知识：MiniMax Agent 研究分析

1. MiniMax Agent 概述

定义与解释

MiniMax Agent 是由中国的大模型创业公司 MiniMax 开发的一种 AI 智能体。它具备执行复杂推理和处理多模态内容（文本、图像、视频、音频等）的能力。MiniMax Agent 提供“标准”和“深度”两种工作模式，以适应不同复杂程度的任务需求。“深度”模式虽然耗时较长，但通常能提供更高质量的任务完成效果。

关键事实与最新发展

2025 年 5 月，MiniMax 启动了其 Agent 产品的内测，允许用户通过自然语言输入任务，由 Agent 自动执行，应用场景涵盖文档核查、旅游规划、内容创作等。
MiniMax Agent 在执行任务时，会进行任务拆解，并通过“思维链”(Chain of Thought)的方式展示其具体的思考步骤、初步结论，并进行迭代优化和纠错。
与其他 Agent 产品（如 Manus）相比，MiniMax Agent 的思维链展示可能更为详尽和繁复，旨在提供更透明、更准确的推理过程。

2. MiniMax Agent 的技术架构

线性注意力机制：
MiniMax 的 MiniMax-01 系列大模型据称首次大规模实现了线性注意力机制，这使得模型能够高效处理极长的上下文（例如长达 400 万 token），远超当时主流模型的上下文长度。
多模态融合：
MiniMax Agent 强调对文本、语音、音乐、视频、图像等多种模态内容的融合处理能力，致力于提供更丰富的 AI 原生应用体验。

3. MiniMax Agent 的应用场景

AI 原生应用

MiniMax Agent 的能力已应用于其公司的 C 端产品，如“海螺 AI”（一款综合性 AI 助手），提供 Chatbot 类智能问答、视频生成、多模态互动陪伴等服务。

语音模型 Speech02

MiniMax 发布的语音模型 Speech02，在多项全球语音基准测评中表现优异，展现了其在语音处理方面的技术实力，这也是 Agent 多模态能力的重要支撑。

4. MiniMax Agent 的市场与竞争

Agent 赛道升温：
2025 年初以来，AI Agent 赛道持续火热，国内外多家公司（包括 MiniMax, Manus, 以及其他大厂）纷纷推出或内测各自的 Agent 产品，显示出市场对智能自主代理的强烈需求。
竞争对手比较：
MiniMax Agent 与 Manus 等产品在功能和定位上存在竞争。MiniMax 可能在多模态处理能力和思维链的深度与透明度方面具有其特色和优势。