前言
近日,OpenAI 召开春季发布会,推出了一款名为 GPT-4o 的“旗舰级”生成式人工智能模型,并将在未来几周内在公司面向开发者和消费者的产品中迭代推出。该模型将向免费客户开放,这意味着任何人都可以通过 ChatGPT 访问 OpenAI 最先进的技术。
会前,OpenAI 首席执行官(CEO)萨姆·奥特曼(Sam Altman)神秘兮兮地发了一条推文,给整个发布会奠定了基调:
GPT-4o 模型发布
Muri Murati紧接着将焦点转移到GPT-4o模型的推出上,这一模型是对现有技术的重大突破,它首次将GPT-4级别的智能提供给所有用户,包括免费用户。GPT-4o不仅在文本处理方面表现卓越,而且在图像和音频处理方面也实现了显著提升,这标志着人机交互进入了一个更加自然和便捷的新纪元。
Murati 随后指出,OpenAI 的一个关键目标是为更多人提供先进的 AI 工具,通过简化使用门槛,例如让 ChatGPT 无需注册即可访问,以及推出桌面应用,使技术更加易于获取。这些举措旨在直观展示技术的潜力,促进更广泛的认知融合。GPT-4o 的发布标志着人机交互的新纪元,它能够处理对话中的细微之处,如自然语言理解、环境噪音过滤和多声部对话,这些都是传统上对 AI 模型的重大挑战。GPT-4o 通过集成转录、智能分析和文本转语音等功能,显著减少了交互的延迟,提升了用户体验的沉浸感。
过去仅对付费用户开放的一些高级功能,现在由于 GPT-4o 的效率提升,将免费提供给所有用户。这使得更多的用户能够享受到定制化体验、视觉上传功能、记忆和浏览功能,以及高级数据分析服务。
Murati 宣布,ChatGPT 的用户已经突破了 1 亿大关。
GPT-4o模型的全新功能
GPT-4o不仅具备理解和生成自然语言的能力,还能处理语音输入,从而使得语音助手和自动客服等应用更加智能化和人性化。用户可以通过语音提问,GPT-4o能够实时分析和提供精准的回答,其实时音频处理能力将显著提升用户的交互体验。
GPT-4o的视觉处理能力同样引人注目。它能够识别和分析图像中的内容,并利用文本信息提供详尽的描述和分析。这对于图像识别和自动驾驶等领域具有重大意义。例如,在自动驾驶系统中,GPT-4o能够分析摄像头捕捉的图像,识别道路标志、行人和障碍物,从而提升行车安全性。
GPT-4o继承了GPT系列模型的卓越自然语言处理能力。它能够解读复杂的句子结构及其背后的语义联系,并生成连贯且逻辑严密的文本。这使得它在文本生成、翻译、摘要提取等应用中表现尤为突出。无论是编写技术文档还是创造性地生成内容,GPT-4o都能够出色完成任务。
更多工具免费解锁
OpenAI宣布,他们已经开始向ChatGPT Plus和Team订阅用户推出GPT-4o,并计划在不久的将来向企业用户开放。此外,他们今天还推出了ChatGPT Free版本,但会有一定的使用限制。Plus用户的每日消息限额将是免费用户的五倍,而团队和企业用户的限额会更高。
新闻稿中提到,即使是ChatGPT Free用户也有机会体验GPT-4o,但当达到使用限额时,ChatGPT将自动切换回使用GPT-3.5模型。
另外,OpenAI还发布了适用于macOS的ChatGPT桌面应用程序。用户可以通过按Option + Space快捷键立即向ChatGPT提问,并且可以直接在应用程序中截取屏幕截图并与机器人进行交互。
文章结尾
如有疑问或有需求可以进群交流。

