老板说:“要有趣、有网感、能传播。”
于是,有了这篇文章。
说实话,这条视频能成,DeepSeek帮了大忙——从素材整理、文案创作,到分镜头脚本、提示词撰写,再到这篇教程本身,每一步都有它的参与。
如果你也在用AI辅助做视频,这篇文章可能对你有用。
下面是我生成好的成品
01 第一步:定调性,想清楚要“说什么”
接到任务的第一反应,是去网上搜了一圈“上海狗狗幼稚园”的相关信息。
我发现了几个关键点:
真的有这样一家店,叫“爪立方”,在上海宝山
狗要上社交礼仪课、有下午茶、按性格分班
家长们疯狂到租“学区房”、跨区送学、成立家委会
我当时的判断是:
这件事本身已经很“离谱”了,不需要编,只需要把事实讲出来,加一点调侃,就是天然的爆款素材。
于是,我打开DeepSeek,把我搜集到的素材全部喂给它,让它帮我做两件事:
总结事件要点
生成带调侃讽刺风格的文案
DeepSeek给了我什么:
它先帮我梳理了一份清晰的总结,把“狗狗课程表”“师资配置”“家长疯狂行为”这些关键信息提炼出来,让我对素材心里有数。
然后,它生成了一段完整的文案,我直接拿来用了——就是视频里那些“当你的狗开始上学,你就知道内卷不分物种了”“活得不如狗是认真的”这些金句,都是DeepSeek的手笔。
💡 小技巧:做热点类视频,先问DeepSeek三个问题——
这件事最“离谱”的点是什么?
观众看完最想吐槽什么?
我想让观众看完什么感受?
把素材丢给它,让它帮你总结。你会发现,它提炼的角度,往往比你自己想的更有网感。
我的答案分别是:
狗上幼稚园、有学区房、有家委会
“活得不如狗”
笑着觉得“有点道理”
定好这三个方向,就可以开始动手了。
下面是我做好的成品
02 第二步:用DeepSeek写分镜头脚本,让即梦“听懂”我要什么
即梦这个工具,核心玩法是:你给它“提示词”,它给你画面。
但提示词不是随便写的,需要非常具体。而且,即梦对提示词的格式有“偏好”——写得越结构化,生成的结果越稳定。
DeepSeek在这里帮了大忙。
我给deepseek看了一个我之前做的一个镜头脚本“徐州博物馆”,然后让deep seek根据脚本格式模板,让它按照同样的格式,为狗狗幼稚园事件生成6个分镜头的完整脚本。
DeepSeek给我的脚本长这样:
分镜头1:上学路上(时长4秒)
💡 小技巧:写提示词的“三要三不要”
要写“环境”:什么风格?什么光线?什么分辨率?
要写“画面”:第几秒到第几秒?拍什么?镜头怎么动?
要写“负面词”:告诉AI“我不要什么”,能有效避免画面崩坏。不要写“字幕”:字幕后期在剪映加,AI生成的字幕通常位置不对。
不要写“模糊描述”:比如“好看”“可爱”这种,AI理解不了。
不要写“复杂动作”:AI生成视频对复杂动作支持有限,尽量简单。
DeepSeek帮我写的这6个脚本,每个都包含环境、画面、负面词三部分,直接复制粘贴到即梦就能用。如果让我自己写,光是琢磨每个镜头的描述,就得花一两个小时。
我在即梦的操作流程:
把DeepSeek写的每个分镜头的“环境+画面+负面”粘贴到即梦的输入框
选择“二次元动漫”风格,新海诚预设
生成后,如果不满意,微调提示词重新生成
每个分镜头我大概生成了3-5次,选最顺眼的那版
⚠️ 避坑提醒:
“不要在视频里生成字幕”这个提示词一定要加,不然AI会乱加字
03 第三步:剪映剪辑,让“片段”变成“故事”
即梦生成的是6个独立的视频片段,需要在剪映里串起来,加上音效、配音、字幕。
我的剪映操作流程:
1. 导入素材,按顺序排列
把6个片段按分镜顺序拖进时间轴,每个片段之间留0.5秒的过渡(用“叠化”转场,效果自然)。
2. 加配音
我用的是剪映的“文本朗读”功能
选了“解说男声”,语速调到1.1倍(快一点更有网感)
画外音文案用的是DeepSeek最初生成的那一版,一个字没改
💡 小技巧:配音的语速要稍微快于正常说话,短视频的节奏就是“快”。
3. 加背景音乐
剪映音乐库搜索“轻快”“幽默”“卡通”
音乐音量调到-15dB左右,不要盖过配音
4. 加音效
脚步声、铃铛声、狗叫声、键盘敲击声、笑声、盖章声……
这些在剪映“音效”库里都有,搜关键词就能找到
音效要卡点,比如狗进门的那一下,正好配上推门声
💡 小技巧:好的音效是“隐形”的——观众不会注意到它,但没有它,画面就干巴巴的。
5. 加字幕
用剪映的“识别字幕”功能,一键生成
但自动识别的字幕通常有错别字,需要逐条校对
字幕字体我用的是“思源黑体”
字幕位置放在画面下方,不要挡住主角
6. 调色
即梦生成的画面已经很“新海诚”了,基本不需要大调
我加了一个“清新”滤镜,强度调到20%,让画面更亮一点
04 第四步:导出与发布
剪映导出设置:
分辨率:1080p
码率:推荐
帧率:30fps
格式:MP4
05 聊聊DeepSeek在这条视频里的“功劳”
这条视频从0到1,DeepSeek参与了多少?我大概算了一下:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
所以,我的真实感受是:
DeepSeek不是“帮我做视频”,而是让我把时间花在“做决策”而不是“写文案”上。
它负责把“想法”变成“可执行的内容”,我负责判断“这个方向对不对”“这个画面好不好”“这个节奏快不快”。
人和AI的分工,大概是这样:
我做的:定调性、判断素材、选画面、剪辑、调音效、做决定
DeepSeek做的:整理信息、写文案、写脚本、写提示词、写教程框架
各司其职,效率翻倍。
06 写在最后:一些“踩过坑”的经验
1. 即梦生成视频,一定要写“负面词”
一开始我偷懒,没写负面词,结果生成出来的画面:有的是写实风,有的是3D渲染,甚至还有水印。加了负面词之后,画面风格统一多了。这个负面词模板,是DeepSeek帮我写的。
2. 配音和音效,是画面的“灵魂”
同样的画面,没有配音和音效,是“默片”;加上了,才是“视频”。
3. 30秒是黄金时长
抖音、视频号、朋友圈,30秒以内的完播率最高。超过1分钟,很多人就划走了。
4. AI是助手,不是替代品
DeepSeek再强,也得有人告诉它“要做什么”。定调性、做判断、把控质量——这些还得自己来。
好了,以上就是我从“接到任务”到“导出成片”的全过程。
如果你也在用DeepSeek+即梦+剪映做视频,希望这篇教程对你有帮助。
最后,送上那句DeepSeek帮我写的画外音:
“狗过得开心,就是年轻人最大的KPI。”
📌 附:本次教程涉及的资源清单
一、AI与创意工具
DeepSeek——素材整理、文案创作、分镜头脚本、提示词撰写、教程框架生成
二、视频生成工具
即梦——视频画面生成(二次元动漫 / 新海诚风格,8k分辨率)
三、剪辑工具
剪映——视频剪辑、配音、音效、字幕、调色
四、视频规格
总时长:30秒
分镜头数量:6个
输出分辨率:1080p
帧率:30fps
格式:MP4
五、字幕样式
字体:思源黑体

