1、英伟达发布 80 亿参数新 AI 模型:精度、效率高,可在 RTX 工作站上部署
2、微软 Azure AI 语音服务推出虚拟人形象,支持文本转视频
微软 Azure AI 语音服务允许开发者构建多语言生成式 AI 语音应用,Azure AI 语音服务最新推出了文本到语音虚拟人功能,可以将简单的文本转换为人类自然说话视频。
将文本转换为由 Azure AI 文本转语音提供支持的人类说话视频,该视频具有自然的声音。
提供不同的人物预设形象。
形象的声音由 Azure AI 文本转语音生成。
使用批量合成 API 异步或实时合成文本到语音人像视频。
在 Speech Studio 中提供内容创建工具,无需编码即可创建视频内容。
-
通过 Speech Studio 中的实时聊天头像工具启用实时人像对话。
3、Ideogram 发布 2.0 全新版本,写实风格显著提升,接近真实照片,还能生成网页设计页面
Ideogram 发布 Ideogram 2.0 版本,这是一款功能强大的文字转图像模型,具有行业领先的生成真实图像、平面设计、排版等能力。
现实主义风格:能够生成高度逼真的图像,纹理和细节(如皮肤和头发)都非常接近真实照片
设计风格:强化了文本的准确性,非常适合制作带有长文本的图形设计,如贺卡、海报和社交媒体内容
3D 风格: 支持生成三维立体感较强的图像
-
动漫风格:专为生成动画或卡通风格的图像而设计
任意宽高比:支持各种宽高比的图像生成,包括 3:1 和 1:3 等非传统比例
-
颜色调控:用户可以指定颜色调色板,以便在生成的图像中保持一致的视觉风格,适用于艺术控制和品牌一致性
Magic Prompt: 自动生成创意性的提示词,帮助用户更轻松地开始创作
-
Describe 功能:根据已有图像生成详细的文本提示,以此为基础创建新的图像
Ideogram API: 开发者可以通过 API 将 Ideogram 的图像生成能力集成到他们的应用中,并且相比其他同类产品,价格更具竞争力
-
iOS 应用:提供了移动端应用程序,用户可以随时随地生成图像(Android 版本将在稍后推出)
-
用户可以通过文本搜索访问超过 10 亿张公开生成的图像,找到灵感并探索他人的创作(@小互 AI)
4、马斯克点赞可灵 AI
5、原 Character.AI CEO 诺姆・沙泽尔将任谷歌 Gemini 联合技术负责人
1、Rippleing 创始人:你的公司 AI washing 了吗?

