

OpenAI 表示，ChatGPT 现在可以“说话”、聆听和处理图像

跨语桥梁

2023-11-21

3541

导读： OpenAI 的 ChatGPT 现在可以“看、听、说”

OpenAI 表示，聊天机器人的更新将在未来两周内向付费用户推出。
OpenAI 大力推动功能的同时，OpenAI、微软、谷歌和 Anthropic 等聊天机器人领导者之间的人工智能军备竞赛的风险也不断增加。
该公司周一宣布，OpenAI 的 ChatGPT 现在可以“看、听、说”，或者至少能够理解口语、用合成语音做出回应并处理图像。

聊天机器人的更新是 OpenAI 自推出 GPT-4以来最大的一次更新，允许用户选择在 ChatGPT 的移动应用程序上进行语音对话，并从五种不同的合成声音中进行选择以供机器人进行响应。用户还可以与 ChatGPT 共享图像并突出显示重点或分析区域（想一想：“这些是什么类型的云？”）。

OpenAI 表示，这些变化将在未来两周内向付费用户推出。虽然语音功能将仅限于 iOS 和 Android 应用程序，但图像处理功能将在所有平台上提供。

随着 OpenAI、微软等聊天机器人领导者之间人工智能军备竞赛的风险不断加大，功能的大力推动也随之而来。，谷歌和人择。为了鼓励消费者在日常生活中采用生成式人工智能，科技巨头不仅竞相推出新的聊天机器人应用程序，而且还推出新功能，尤其是在今年夏天。谷歌宣布对其 Bard 聊天机器人进行一系列更新，微软则在 Bing 中添加了视觉搜索。

据 PitchBook 称，今年早些时候，微软扩大了对 OpenAI 的投资—— 额外投资了 100 亿美元 ——使其成为今年最大的人工智能投资。据报道，4 月份，这家初创公司以 270 亿至 290 亿美元的估值完成了 3 亿美元的股票发售，投资方包括红杉资本 (Sequoia Capital) 和安德森霍洛维茨 (Andreessen Horowitz) 等公司。

专家们对人工智能生成的合成声音表示担忧，在这种情况下，这可以为用户提供更自然的体验，但也可以实现更令人信服的深度伪造。网络威胁行为者和研究人员已经开始探索如何利用深度伪造来渗透网络安全系统。

OpenAI 在周一的声明中承认了这些担忧，并表示合成声音是“由我们直接合作的配音演员创建的”，而不是从陌生人那里收集的。

该新闻稿还没有提供有关 OpenAI 如何使用消费者语音输入，或者该公司将如何保护这些数据（如果使用的话）的信息。该公司的服务条款规定，消费者“在适用法律允许的范围内”拥有自己的投入。

OpenAI 向 CNBC 提及了该公司关于语音交互的指南，该指南指出 OpenAI 不会保留音频剪辑，并且音频剪辑本身不会用于改进模型。

但该公司还指出，转录被视为输入，可用于改进大语言模型。
原文链接：https://www.cnbc.com/2023/09/25/chatgpt-speak-listen-process-images-openai.html

【声明】内容源于网络

OpenAI

跨语桥梁

大家好

内容 4508

粉丝 8

跨语桥梁大家好

总阅读31647.8k

粉丝8

内容4.5k