VEED Fabric 1.0 上线：一张图片 + 你的声音，1 分钟出片- 大数跨境

程序员老鬼

2025-09-16

VEED推出Fabric 1.0：AI驱动“会说话的图片”上线

VEED正式发布Fabric 1.0，该技术可将静态图像转化为能“开口说话”的动态视频。用户只需上传一张正面清晰的人像图并搭配音频（可自行录制或使用TTS生成），系统即可生成口型、表情与语音同步的生动视频，实现高度拟真的视觉效果。

Fabric 1.0并非临时推出的插件功能，而是VEED全新设立的AI视频模型线，已集成在平台“AI视频模型”入口中，标志着其作为长期产品方向的战略布局。

VEED同步推出了独立的Lipsync API，官方称其为“全球最强唇形同步技术”，支持开发者接入以实现大规模内容生产，尤其适用于多语言本地化场景，提升跨区域内容制作效率。

官方明确列出主要应用场景：社交广告、产品演示、播客封面、UGC内容及教学类视频等。凡需人物出镜讲解的场景，均可通过该技术快速生成测试版本，降低前期制作成本。

操作流程极为简便：上传图像→导入音频→自动生成→在线编辑。生成后的视频可在VEED编辑器内直接添加字幕、品牌Logo，并调整尺寸适配移动端（如9:16格式），实现从素材到成品的一站式输出。

值得一提的是，VEED此前已有“会说话照片”相关工具，Fabric 1.0可视为其技术升级版，由功能模块进化为底层模型引擎。

关于视频时长：目前社区反馈存在差异，有称支持1分钟，亦有提到可达3分钟，但官方未明确上限。建议以60秒为基准进行内容规划，较长内容可分段生成后拼接，确保稳定性。
追求更高唇形同步精度或多语言适配时，推荐启用Lipsync API，显著提升口型匹配度。
Lipsync API采用申请制或等候名单机制，无法即时批量调用。建议优先在网页端完成全流程验证后再推进规模化应用。

Fabric 1.0的本质并非简单复制“虚拟人”概念，而是对“口播内容生产线”的重构：美术设计提供人设图像 + 内容团队输出文案与音频 → 批量生成口播视频 → 轻量剪辑包装上线。这一模式大幅降低了真人出镜的内容门槛，特别适合小型团队或预算有限项目快速铺量。

未来可探索方向包括同一形象多语言讲解系列，在TikTok、YouTube Shorts等平台测试传播效果，挖掘全球化内容生产的潜力。

【声明】内容源于网络

程序员老鬼

1234

内容 1665

粉丝 0

程序员老鬼 1234

总阅读27.0k

粉丝0

内容1.7k