背景
我想用 AI 做视频。Agnes AI是新加坡的一家AI公司,它的这个Agnes AI据说从2026年6月1日开始全面开放,用户可以完全免费使用。基于这个条件,我想在trae中测试一下一条语句免费生成视频的情况。
在 Trae 里对话,出视频
我把想法丢进 Trae 的聊天窗口,跟它说:
第一句: "用 Agnes AI 做视频,跑通看看效果。"
Trae 把 API 跑通了,自动配好了参数,跑出了第一个视频。
第二句: "效果太差了,角色完全不一样。能不能先定好角色形象,后面的镜头都用这个形象?"
Trae 在图像生成和视频生成之间加了一步:先生成角色参考图,再传进视频生成。
第三句: "做一个完整的故事试试。"
我选了"女娲造人"这个故事。Trae 自动把故事拆成四个分镜,每个 5 秒,用同一个角色参考图去生成,最后自动拼成一条完整视频。
第四句: "做电商商品图可以吗?"
Trae 说可以,逻辑一样——先生成产品标准图,再用这张图做不同场景的商品图。
生成的效果(只给你们看好看的部分,agnes免费模型生成效果其实并不理想)
我做的事
从头到尾,我实际做的事只有这些:
提需求:想做什么效果,碰到什么问题
给参考:女娲造人这个故事,以及做电商商品图的场景
确认效果:看视频,判断好不好,要不要调
代码怎么写、接口怎么调、错误怎么处理、配置怎么配——这些都是 Trae 完成的,我没有碰。
角色一致性的效果
最直观的感受:有参考图之后,同一个角色确实稳住了。
直接生成: 角色形象飘,每次生成的都不一样。
先出参考图再用: 同一个角色从头到尾长得差不多,连贯性好很多。
核心思路就是一句话:先定角色,再用这个角色去生成每个镜头。
用在电商上
逻辑完全一样。比如做一款台灯的商品图:
先生成台灯的标准产品图
用这张图当参考,生成不同场景的展示图
台灯放在客厅、卧室、办公桌——出来的产品形象是同一个,场景在变。这正是电商需要的。
一些实际感受
最费时间的是写描述和等生成。 描述写得越清楚,出来的东西越接近想要的。等的话,免费版大概每个分镜等几分钟,四个镜头跑完十几分钟。
角色一致性是值得做的。 直接出视频的话,角色形象很难控制。先定参考图再生成,省了很多反复调整的麻烦。
需要说明一下,Agnes AI免费模型生成的效果并不好,不过它现在也接入了字节的seedance模型,追求视觉效果的可以选择。可能需要收费。
整个项目在 Trae 里完成,视频生成用的是 Agnes AI,视频拼接用的是 FFmpeg。

