阿里云开放了一个名为“统一万向”的生成式人工智能文本到图像模型,供中国企业客户进行测试,这是其不断增长的基于人工智能的应用程序套件的一部分。“统一万象”在普通话中的意思是“万象”。
统一万象可以根据自然语言提示生成图像,范围从水彩画、油画到动画和3D卡通。除了简单地生成图像之外,它还可以将一幅图像的风格应用于另一幅图像,或者创建内容和风格与原始图像相似的图像变体。
统一万向由阿里云专有的大型模型 Composer 提供支持,这是一种文本到图像的扩散模型,能够在给定任何文本输入的情况下生成照片般逼真的图像。
阿里巴巴引用的用例包括从创新人工智能艺术到电子商务、游戏、设计到广告等各行业企业的创意表达等各种用例。
这听起来与SnapFusion类似,尽管 Snapchat 的版本可以在移动设备上运行,生成速度不到 2 秒。事实上,阿里巴巴指出,其他图像创作平台已经在全球发布,例如Midjourney和Stable Diffusion,但统一万向将特别适应全球第二大经济体的公司需求。统一万向能够理解普通话和英语的提示。
7月7日,阿里云推出了 ModelScopeGPT。该框架使用阿里巴巴开源技术社区 ModelScope 中的大型语言模型作为接口,将各种人工智能模型链接在一起,以更有效地执行任务。通过结合 ModelScope 上各种人工智能模型的力量,ModelScopeGPT 可以产生文本、图像、音频和视频的输出。阿里云表示,该框架可以帮助企业和开发人员跨语言、视觉和语音执行复杂的人工智能任务。
文章翻译自:channelx;原文链接:https://channelx.world/2023/07/alibaba-cloud-generative-ai-text-to-image/

