全球首位人工智能DJ诞生；《黑镜》展现了当前AI的噩梦；AI直播因不当言论被禁- 大数跨境

首页

全球首位人工智能DJ诞生；《黑镜》展现了当前AI的噩梦；AI直播因不当言论被禁

学术头条

2023-06-19

导读：上周值得关注的人工智能新动态。

上周值得关注的人工智能新动态：

全球首位人工智能 DJ 诞生
来，AI 帮你创建动漫肖像
开发人员正在积极拥抱 AI 工具
零样本文本指导的视频到视频翻译
多模态语境下的指令微调
禁止纯 AI 生成的音乐参与格莱美提名
AI 生成的直播因不当言论被禁
Meta 推出了 MusicGen 和 Voicebox
人声克隆将用于有声书籍
《黑镜》展现了当前 AI 的噩梦
OpenAI 和谷歌正尝试与媒体公司合作

全球首位人工智能 DJ 诞生

美国一家电台 KBFF Live 95.5 FM 通过使用 RadioGPT 软件，成为世界上首个推出由人工智能驱动的 DJ 电台，这为电台节目创作和内容推送带来了新的可能。

参考链接：

https://www.foxbusiness.com/technology/worlds-first-ai-dj-airwaves-oregon-radiogpt

来，AI 帮你创建动漫肖像

研究人员提出了 AniFaceDrawing，可以使用 StyleGAN 将粗糙的草图转换为高质量的动漫肖像。

论文链接：

https://arxiv.org/abs/2306.07476

开发人员正积极拥抱AI工具

Stack Overflow 的一项调查显示，44% 的开发人员已经在使用 AI 工具，另有 26% 的开发人员将很快会使用。

另外，77% 的开发人员对 AI 工具在其开发工作中扮演的角色感到满意；33% 的开发人员认为提高生产力是他们选择使用 AI 工具的最重要原因；42% 的开发人员表示，他们相信 AI 工具输出内容的准确性。

参考链接：

https://stackoverflow.co/labs/developer-sentiment-ai-ml/

零样本文本指导的视频到视频翻译

研究人员公布了一个新颖的零样本文本指导的视频到视频的翻译框架，适应图像模型以创建高质量的连贯视频。该框架以较低的成本（无需重新训练或优化）实现了全局风格和局部纹理的时间一致性，其适应性与现有的图像扩散技术兼容。

论文链接：

https://arxiv.org/abs/2306.07954

多模态语境下的指令微调

S-Lab和微软训练了一个精通多模态感知和推理的视觉语言模型——Otter，人工评估显示，Otter 在多模态感知、推理和语境学习方面展现出了惊人的能力，且可以有效地与用户的意图保持一致。

此外，他们也提出了一个用于训练视觉语言模型的大型数据集——MIMIC-IT，其包含280万个多模态指令-反应对，其中有220万个为图像和视频指令。

论文链接：

https://arxiv.org/abs/2306.05425

禁止纯AI生成的音乐参与格莱美提名

格莱美禁止完全由 AI 生成的音乐参与提名，只有以人类为主导且做出重要贡献的音乐才有资格竞争奖项。

参考链接：

https://boingboing.net/2023/06/18/solely-ai-generated-music-shut-out-of-grammys-with-new-rule.html

AI生成的直播因不当言论被禁

AI生成的《恶搞之家》直播因涉及炸弹威胁言论被禁。之前，AI 生成的《宋飞正传》直播因恶意言论也被暂停播放。

参考链接：

https://www.nme.com/news/tv/ai-generated-family-guy-livestream-banned-after-making-a-bomb-threat-3457051

Meta 推出了 MusicGen 和 Voicebox

Meta 公司推出了开源音乐生成器 MusicGen 和 Voicebox。MusicGen 能将文字描述转化为音频，而 Voicebox 具备语音生成、编辑和风格化功能。

据介绍，Voicebox 超越了其他音频 AI 模型，它采用 Flow Matching 模型，能够实现文本与语音之间的非确定性映射，从而可以在不需要大量标注的情况下从各种语音数据中学习。

参考链接：

https://www.neowin.net/news/meta-announces-voicebox-its-generative-ai-model-for-audio/

https://techcrunch.com/2023/06/12/meta-open-sources-an-ai-powered-music-generator/

人声克隆将用于有声书籍

未来十年内，有声书的年销售额有望超过300亿美元，其中人工智能将扮演更重要的角色。

Google Play 和 Apple Books 采用了人工智能生成的声音，但在模仿人声的语调、抑扬顿挫和情感方面仍待完善。

声优们建议克隆自己的声音以加快有声书籍的制作速度，降低成本。

参考链接：

https://www.cnbc.com/2023/06/17/ai-voice-clones-are-coming-for-the-amazon-apple-google-audiobook.html

《黑镜》展现了当前AI的噩梦

Netflix 的《黑镜》第六季首播集《Joan很糟糕》展现了当前AI的噩梦。该剧探索了移动设备监视和人工智能失控的问题。

此前，《黑镜》制片人 Charlie Brooker 表示，他曾经 ChatGPT 写了一集《黑镜》剧本，结果“像屎一样”。

参考链接：

https://www.salon.com/2023/06/17/black-mirror-netflix-joan-is-awful-ai/

OpenAI和谷歌正尝试与媒体公司合作

据知情人士透露，近几个月来，OpenAI、谷歌、微软和 Adobe 都曾与媒体机构高管会面，讨论围绕他们的 AI 产品（如文本聊天机器人和图像生成器）的版权问题。他们希望达成一项通过向出版商付费以利用新闻内容来训练生成式人工智能模型的协议。

这些媒体机构包括新闻集团（News Corp）、Axel Springer、《纽约时报》（The New York Times）和《卫报》（The Guardian）等。

参考链接：

https://www.ft.com/content/79eb89ce-cea2-4f27-9d87-e8e312c8601d

｜点击关注我 👇 记得标星｜

【声明】内容源于网络

学术头条

致力于学术传播和科学普及，重点关注大模型、AI4Science 等前沿科学进展。

内容 1019

粉丝 0

学术头条致力于学术传播和科学普及，重点关注大模型、AI4Science 等前沿科学进展。

总阅读605

粉丝0

内容1.0k

​全球首位人工智能DJ诞生；《黑镜》展现了当前AI的噩梦；AI直播因不当言论被禁

全球首位人工智能DJ诞生；《黑镜》展现了当前AI的噩梦；AI直播因不当言论被禁