大数跨境
0
0

OpenAI发布语音模型GPT-realtime

OpenAI发布语音模型GPT-realtime 汉斯出版社
2025-09-03
2
导读:关注汉斯出版社公众号即可获取最新论文资讯!

点击上方蓝字关注我们!



8月28日,美国人工智能公司OpenAI发布了其所谓“最先进的语音到语音模型”GPT-realtime,以及配套的Realtime API(实时应用程序接口)。

图源:美国OpenAI官网




据OpenAI公司介绍,该模型在理解复杂指令、精准调用工具以及生成自然、富有表现力的语音方面表现突出,并在客户服务、教育、个人助理等多种场景中具备广泛应用潜力。


与传统语音模型不同,GPT-realtime新增了Marin与Cedar两种极具特色的语音,同时对原有8种语音进行了全面升级。模型不仅能生成自然流畅的语音,还能够敏锐捕捉笑声等非语言信号,在句子中间自如切换语言,并可根据场景需求灵活调整语气,使语音交互更贴近真实人类沟通。


通过Realtime API,开发者可实现实时语音输入输出,不必再经过繁琐的多模型转换流程。在实际应用中,这套技术可用于客户服务系统,让虚拟助手即时解答问题,提高效率和体验。它还可应用于教育领域,实现语音对话和口语练习。而在个人助理、办公或智能家居场景中,用户能通过语音快速完成安排或查询信息。结合图像或文本输入,开发者还能打造更智能的虚拟助手或机器人系统。


OpenAI表示,GPT-realtime和Realtime API已于8月28日起面向所有付费开发者开放。


图片

来源:科技日报(作者:张佳欣),仅用于学术分享,版权属于原作者。

声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本公众号观点或证实其内容的真实性;如其他媒体、网站或个人从本公众号转载使用,须保留本公众号注明的“来源”,并自负版权等法律责任。如本公众号内容不妥,或者有侵权之嫌,请先联系小编删除,万分感谢。

联系方式


电话:027-86758873

QQ:2194278918

微信:15802748706

投稿邮箱:2194278918@qq.com

合作联系:service@hanspub.org










汉斯公众号二维码.jpg

扫码关注联系小编投稿

获取更多新闻咨讯

同时还可获取最新论文模板



RECOMMEND

推荐阅读

免疫衰老是免疫治疗耐药的关键因素

环境保护前沿|中国农户宅基地福利研究热点与展望

活动|9月最新优惠期刊来袭


图片


点击“阅读原文”,免费下载论文


【声明】内容源于网络
0
0
汉斯出版社
汉斯出版社(Hans Publishers)是一家国际综合性出版机构,聚焦于国际开源 (Open Access) 中文期刊全球的出版发行。
内容 2466
粉丝 0
汉斯出版社 汉斯出版社(Hans Publishers)是一家国际综合性出版机构,聚焦于国际开源 (Open Access) 中文期刊全球的出版发行。
总阅读34
粉丝0
内容2.5k