大家都沉浸在 Sora 的惊艳中时,2月21日 Stable Video Diffusion 1.1 官网正式开放了公测!
Stable Video 提供2种视频生成方式,一种是上传图片以生成视频:
另外一种则和 Sora 相同,可以通过文本输入生成视频:
不过根据网友反馈,该模型对于展示静止物体来说很不错,但对动漫人物肖像的尝试通常不成功。
如果人物有脸,通过调低motion值也可以得到相对正常结果,但不知道为什么会出现卡顿。
还有网友调侃这侧面证明其长得不符合模型预期,更加期待 Sore 。
不过除了人像,对于风景类视频生成,Stable Video 也有可圈可点之处。
除此之外,昨日 Stability 还宣布推出 Stable Diffusion 3 的早期预览版。
这是一款文本到图像的模型,它利用 Diffusion Transformer 架构提高了多主题提示、图像质量和拼写能力的性能。
不过该模型尚未广泛使用,但 Stability 目前正在开放候补名单以进行早期预览,大家可以注册加入候补名单:
https://stability.ai/stablediffusion3
Stable Diffusion 3 型号套件目前范围从 800M 到 8B 不等。
这使访问民主化,为用户提供各种可扩展性和质量选项,以最好地满足大家的创意需求。
部分案例
部分案例
从细节上看,无论是光影还是清晰度,Stable Diffusion 3 都有所提高。
Prompt:厨房的桌子上放着一块绣花布,上面写着“晚安”和一只绣着小老虎。在布的旁边有一根点燃的蜡烛。灯光昏暗而引人注目。
Prompt:一幅宇航员骑着一头穿着芭蕾舞短裙的猪,手里拿着一把粉红色的雨伞,猪旁边的地上是一只戴着礼帽的知更鸟,角落里是“Stable Diffusion”的字样。
ChatU.AI可免费申请试用,支持企业私有部署,多引擎AIGC操作系统安全稳定,点击下方公众号一键试用!