0
0

OpenAI 表示,ChatGPT 现在可以“说话”、聆听和处理图像

跨语桥梁
2023-11-21
3386
shoptop 【建站扶持计划】

免费7天,首月1元! 16大主流媒体免费开户

   立即查看>>

大数跨境 导读: OpenAI 的 ChatGPT 现在可以“看、听、说”

OpenAI 表示,聊天机器人的更新将在未来两周内向付费用户推出。
OpenAI 大力推动功能的同时,OpenAI、微软、谷歌和 Anthropic 等聊天机器人领导者之间的人工智能军备竞赛的风险也不断增加。
该公司周一宣布,OpenAI 的 ChatGPT 现在可以“看、听、说”,或者至少能够理解口语、用合成语音做出回应并处理图像。

聊天机器人的更新是 OpenAI 自推出 GPT-4以来最大的一次更新,允许用户选择在 ChatGPT 的移动应用程序上进行语音对话,并从五种不同的合成声音中进行选择以供机器人进行响应。用户还可以与 ChatGPT 共享图像并突出显示重点或分析区域(想一想:“这些是什么类型的云?”)。

OpenAI 表示,这些变化将在未来两周内向付费用户推出。虽然语音功能将仅限于 iOS 和 Android 应用程序,但图像处理功能将在所有平台上提供。

随着 OpenAI、微软等聊天机器人领导者之间人工智能军备竞赛的风险不断加大,功能的大力推动也随之而来。,谷歌和人择。为了鼓励消费者在日常生活中采用生成式人工智能,科技巨头不仅竞相推出 新的聊天机器人应用程序,而且还推出新功能,尤其是在今年夏天。谷歌宣布对其 Bard 聊天机器人进行一系列更新,微软则在 Bing 中添加了视觉搜索。

据 PitchBook 称,今年早些时候,微软扩大了对 OpenAI 的投资—— 额外投资了 100 亿美元 ——使其成为今年最大的人工智能投资。据报道,4 月份,这家初创公司  以 270 亿至 290 亿美元的估值完成了 3 亿美元的 股票发售,投资方包括红杉资本 (Sequoia Capital) 和安德森霍洛维茨 (Andreessen Horowitz) 等公司。

专家们对人工智能生成的合成声音表示担忧,在这种情况下,这可以为用户提供更自然的体验,但也可以实现更令人信服的深度伪造。网络威胁行为者和研究人员已经开始探索如何利用深度伪造来渗透网络安全系统。

OpenAI 在周一的声明中承认了这些担忧,并表示合成声音是“由我们直接合作的配音演员创建的”,而不是从陌生人那里收集的。

该新闻稿还没有提供有关 OpenAI 如何使用消费者语音输入,或者该公司将如何保护这些数据(如果使用的话)的信息。该公司的服务条款规定,消费者“在适用法律允许的范围内”拥有自己的投入。

OpenAI 向 CNBC 提及了该公司关于语音交互的指南,该指南指出 OpenAI 不会保留音频剪辑,并且音频剪辑本身不会用于改进模型。

但该公司还指出,转录被视为输入,可用于改进大语言模型。
原文链接:https://www.cnbc.com/2023/09/25/chatgpt-speak-listen-process-images-openai.html

【版权声明】秉承互联网开放、包容的精神,大数跨境欢迎各方(自)媒体、机构转载、引用我们原创内容,但要严格注明来源大数跨境;同时,我们倡导尊重与保护知识产权,如发现本站文章存在版权问题,烦请将版权疑问、授权证明、版权证明、联系方式等,发邮件至 contact@10100.com,我们将第一时间核实、处理。
0
0
跨语桥梁
大家好
内容 4367
粉丝 5
关注
跨语桥梁 大家好
总阅读29716.0k
粉丝5
内容4.4k
主页
关注