大数跨境
分享
DeepMind发布“力提示”技术,提升AI视频生成真实感
2025-06-04 10:34 星期三
谷歌DeepMind联合布朗大学推出一项名为“力提示”(force prompting)的新技术,为视频生成带来重要进展。该技术无需依赖3D模型或物理引擎,只需设定力的方向和强度,就能生成自然、流畅的运动效果。它支持两种模式:全局力(如风吹)和局部力(如敲击物体),并通过矢量场的形式将力输入系统。 这项研究基于CogVideoX-5B-I2V模型,并引入ControlNet模块处理数据,借助Transformer架构生成49帧视频。整个训练过程仅需四块Nvidia A100 GPU运行一天即可完成。训练所用数据完全由合成场景构成,包括旗帜飘扬、球体滚动等常见物理现象。 研究人员在文本提示中加入物理术语后,模型能够自动建立正确的力与运动之间的关系,并展现出良好的泛化能力。用户测试结果显示,“力提示”在动作匹配度和画面真实感方面优于现有基准模型。尽管在处理复杂场景时仍有局限,但这一进展表明AI正在逐步掌握物理规律,向更通用的人工智能迈进。 相关人士指出,这项技术是人工智能发展过程中的一个重要里程碑。
新闻推荐 查看更多
大数新闻社群
7x24h跨境新闻推送
加入卖家交流群