近日,在OpenAI为期12天的连续直播发布会的第六天,OpenAI推出了ChatGPT的视频聊天功能。这项功能是ChatGPT高级语音模式(Advanced Voice Mode)的重要组成部分,它最初在5月13日的春季直播中亮相,与GPT-4o模型一同发布。经过近四个月的测试,到了9月24日,OpenAI宣布高级语音模式的测试阶段结束,并开始向用户正式推出。

不过,当时推出的并非该模式的完整版,仅包括了语音聊天功能,而缺少了视觉互动功能,比如视频聊天和屏幕共享。对于高级语音模式的具体细节,感兴趣的朋友可以深入了解。
视频聊天
在最新的高级语音模式中,用户可以在应用程序界面上发现一个视频聊天图标,点击该图标即可进入视频聊天界面。类似于微信的视频通话功能,但聊天对象换成了ChatGPT,它能够通过摄像头捕捉周围环境,使得对话更加生动和实用。
高级语音模式(Advanced Voice Mode)依托于原生的多模态GPT-4o模型,支持端到端的语音和视频交流,即直接处理音频输入、理解并输出音频信号,并且支持超过50种语言(这一点超越了目前的Gemini实时语音技术),为用户提供更自然、更具情感的交流体验。

与AI进行实时视频聊天的功能在多个领域都非常实用,无论是工作、日常生活还是学习。例如,在今天的演示中,ChatGPT指导用户如何冲泡手冲咖啡。ChatGPT能够识别桌面上的咖啡器具,并提供分步指导,同时在整个过程中提供实时观察和反馈,确保每一步操作都准确无误。
屏幕共享
除了提供常规的视频通话功能外,ChatGPT的高级语音模式还具备拍照、上传图片和屏幕共享的能力。用户可以通过点击高级语音页面底部的三个点图标来访问这些功能。

当用户选择共享屏幕时,ChatGPT能够主动解析并理解屏幕上显示的内容,这一特性非常适合用于让ChatGPT分析网页信息,例如短信和电子邮件。这就像是拥有了一个能够实时对话并即时获取屏幕信息的AI助手。
圣诞模式
ChatGPT专门针对圣诞节推出了圣诞模式!
用户可以通过点击聊天窗口右侧的雪花图标来进入圣诞模式,与圣诞老人进行互动,他会用他那标志性的欢乐语调实时回复你。

需要提醒的是,这个圣诞模式是一个限时活动,只在今天起至12月底这段时间内提供。
如何与ChatGPT视频聊天?
OpenAI官方表示,他们正在将高级语音模式中的新功能,包括视频聊天、屏幕共享和图片上传,逐步向ChatGPT Pro、Plus、Team的付费用户进行灰度发布,预计在接下来的几天内全部完成。

要判断自己是否已经获得了这些新功能,方法很简单:
当你进入ChatGPT的高级语音模式后,如果发现左下角出现了视频聊天图标,那就说明你已经可以使用视频功能了。你只需点击该图标,就能开始与ChatGPT进行视频通话。
需要注意的是,完整的高级语音模式功能仅对付费用户开放,而免费用户则可以试用体验一小段时长。
为什么选择Azure OpenAI服务?
微软Azure OpenAI服务可以合规、稳定地提供企业用户使用ChatGPT模型。出于合规角度,国内企业可以选择微软的Azure OpenAI服务来使用接口,并具有以下优势:
效果一致:与OpenAI官方接口效果相同,无需担心性能差异。
国内IP调用:直接使用国内IP,连接更稳定,响应速度更快。
合规发票:符合国内法规,可直接开具专用发票。
灵活计费:按Token使用量计费,用多少付多少,成本可控。
技术支持:微软认证技术团队提供专业支持,解决技术难题。
企业优惠:现在签约,享受企业专属折扣。
作为微软的合作伙伴,领驭科技为企业提供绿色申请通道!企业现在就可以申请 OpenAI o1、GPT-4o 、GPT-4o mini!
↓马上申请免费试用↓

深圳领驭科技有限公司,作为微软中国南区的核心合作伙伴及HK CSP资质持有者,已成为国内首批获得Azure OpenAI服务授权的服务商之一。我司正积极整合Azure OpenAI的强大功能,包括先进的自然语言处理、分析和推理能力,到其产品和行业解决方案中。
Azure OpenAI服务通过其大规模生成式AI模型,支持企业客户根据特定需求和场景,开发创新应用,涵盖辅助写作、代码编写、多媒体内容生成以及数据分析等多个领域,为互联网、游戏、金融、零售、医药等行业以及自动驾驶和智能制造等前沿技术领域带来深远影响。
联系我们
深圳领驭科技有限公司
电话:0755 8654 3872
电邮:marketing@leinwin.com
网址:ai.leinwin.com
地址:深圳市南山区粤海街道高新科技园中区科技中三路5号国人通信大厦A座 902

