大数跨境
0
0

12天12场直播!OpenAI如何叩响AGI之门?

12天12场直播!OpenAI如何叩响AGI之门? 瀚鹏AI
2024-12-25
1

当地时间12月5日-20日,人工智能巨头OpenAI完成了连续12个工作日的12场直播,从首日的满血版o1模型重磅发布,再到期待许久的Sora Turbo正式发布,最终又以新一代推理模型o3收官,OpenAI CEO山姆·奥特曼(Sam Altman)还在四场直播中现身站台,我们似乎离AGI(Artificial General Intelligence,通用人工智能)又更近了一步。

让我们来一起回顾OpenAI叩响AGI之门的这12天。



1天:满血版o1模型和ChatGPT Pro



o1模型的完整版在逻辑推理方面进行了显著增强,能够处理国际数学奥林匹克竞赛问题的能力达到了83%,相比之下,GPT-4o在同一测试中的表现仅为13%。

在响应速度方面,o1模型也有了显著提升。例如,在被问及公元2世纪罗马帝国的统治者及其在位时间和成就时,o1模型仅用大约18秒就给出了答案,这一速度远快于GPT-4o模型,并且比o1模型的预览版快了大约60%。

此外,o1模型还新增了多模态图像识别功能,这使得它能够识别手写文字、估算物体的相对尺寸,并且解释如何将零散的零件组装成更大的机械结构。

同时,OpenAI还推出了ChatGPT Pro订阅服务,用户每月支付200美元即可无限制地使用o1模型和高级语音功能。

尽管大多数评论对o1模型的完整版持积极态度,但也有用户指出,由于缺少一些高级功能,o1模型仍然给人一种“预览版”的印象,并且对于没有提供免费产品更新表示不满。

对于ChatGPT Pro的推出,有分析认为这显示了大型AI模型的高成本,同时也反映出在竞争激烈的AI领域中,OpenAI急需通过o1模型来证明自己。




第2天:强化学习微调



用户现在可以使用少量的训练数据,在专业领域迅速打造出达到专家水平的模型。

OpenAI的研究人员解释说,强化微调技术不仅仅是让模型学会输出结果,而是在模型识别出问题时,给予它空间去深思熟虑,然后研究者根据模型的最终答案进行评估。通过强化学习的方法,研究者能够鼓励模型沿着正确的思路进行思考,同时减少错误答案的产生。

经过强化微调的o1-mini模型,在top@1、top@5和top@max这三个关键指标上的表现均优于更强大的o1模型,其中top@1指标指的是模型将正确答案排在首位的概率,top@5是指正确答案出现在前五个选项中的概率,而top@max则是衡量输出中是否包含正确答案的概率。



3Sora Turbo正式发布



Sora Turbo可以生成1080p、最长20秒的视频,支持横屏(16:9)、正方形(1:1)和竖屏(9:16)多种常见比例,并且可以对生成的视频进行Remix(重混):替换、删除或重构视频中的元素,Re-cut(重新切割):找到最佳的一帧再进行延展,循环剪辑,混合:将两个视频进行无缝合并剪辑,故事板剪辑:精准指定每个帧的输入,风格预设:预设创建视频的风格等操作。



4天:Canvas升级



Canvas是OpenAI在今年10月推出的全新功能,OpenAI将其定义为 “使用 ChatGPT 编写和编码的全新工作方式”。

Canvas在单独的窗口中打开,用户和ChatGPT就项目进行协作,不仅仅是通过对话,而是共同创作和完善想法。

可以协作编辑文档,修改标题、添加表情符号、调整文本长度等。

Canvas还支持Python代码运行和调试,能直接查看文本和图形输出,并且ChatGPT能辅助调试并提供修改建议,用户可以快速迭代代码。



5天:ChatGPT正式集成到苹果系统



ChatGPT正式集成到苹果系统中,用户可通过Siri访问ChatGPT功能,并支持语音控制设备。

当Siri判断ChatGPT能够更好地满足用户请求时,会自动将请求转发给OpenAI的系统。用户操作前需先启用该功能,以便保障隐私。

苹果的智能写作工具引入ChatGPT能力。用户不仅能优化、总结文档,提取关键信息,还能从零开始创作全新文档,甚至结合DALL-E图像生成技术在撰写过程中融入图片。

用户还可以轻触苹果的“相机控制”按钮完成视觉智能相关任务,例如快速识别眼前物品,或深入了解所看到的内容,进行翻译、总结等。



6天:增强ChatGPT高级语音模式



GPT-4o增强多模态能力,推出实时视频理解功能,还推出限时圣诞老人语音模式。

用户可直接输入音频,理解并直接输出音频,可以把手机图片或短信等展示给ChatGPT,它将解读并分析这些内容,协助用户回复消息、工作等。



7天:Projects功能发布



Project(项目)支持用户将文件、聊天记录等信息集中到一个“Project”中,与OpenAI竞争对手Anthropic此前推出的Claude新功能有异曲同工之处。

可进行文件上传、设定个性化指令等操作,也支持将过往聊天记录添加到项目中,定制ChatGPT的对话。创建新对话时也能自动搜索项目中的其他信息,进行更精准的回答。此外,还支持Canvas界面,能通过ChatGPT Search轻松接入互联网。



8天:ChatGPT Search开放  



ChatGPT Search正式向所有用户开放,优化了搜索速度和准确性,新增语音搜索功能与地图集成,全球同步上线,提升实时信息获取体验。

以更自然、更会话的方式提问,ChatGPT可以选择用网络信息进行回复。如果深入追问,ChatGPT会考虑您聊天的全部上下文,提供更好的答案。

新媒体集团VoxMedia总裁评价称,ChatGPT Search有望更好地突出值得信赖的新闻来源的信息并对其进行归属,使受众受益,同时扩大提供优质新闻的出版商的影响力。



9天:o1 API正式版



OpenAI称o1 API为功能更强大的模型、新的定制工具,可提高性能、灵活性和成本效益的升级。

支持函数调用、结构化输出和视觉功能;更新支持低延迟自然对话体验Realtime API,可进行简单的WebRTC集成,GPT-4o音频的定价降60%,GPT-4o mini音频费率降为1/10;支持偏好微调,可根据用户和开发人员的偏好更轻松地定制模型;同时还推出了新的Go和Java SDK测试版。

OpenAI给这一天的发布取名为“为开发人员准备的节日礼物”。



10天:推出ChatGPT热线



发布1-800-CHAT-GPT服务,支持WhatsApp即时通讯,同时只要电话拨通免费号码,OpenAI将通过热线提供15分钟的免费ChatGPT使用时间。

OpenAI首席产品官凯文·韦尔(Kevin Weil)在表示:“我们才刚刚开始让每个人都能更方便地使用 ChatGPT。”

有外媒试用了该服务后报道称,AI语音非常逼真,但通话时间限制为每月15分钟,且或许会存在隐私安全问题。



11天:ChatGPT桌面版新增跨应用访问功能



ChatGPT桌面版可读取其他应用程序中的数据,实现实时协作。新增了更多编程环境和生产力工具的支持,可以与 Apple Notes等无缝对接,并支持在使用桌面应用时开启高级语音模式(该功能需要用户手动为每个应用开启)。



12天:o3模型发布



发布最新推理模型o3和o3-mini,推理能力大幅提升,支持多模式推理。

据介绍,在编码测试SWE-Bench Verified中,o3性能比o1高出22.8%;在Codeforces竞技编程中得分为2727分,相当于位列第175名的人类选手,甚至超过了OpenAI的首席科学家(2655分);在数学竞赛AIME 2024和专家级科学问题基准测试GPQA Diamond中成绩都得到明显提升;而在令很多AI和数学家都束手无策的最难数学和推理挑战FrontierMath中,o3解决了25.2%的问题,其他模型均未超过2%。

OpenAI还表示正使用一种新技术“慎重对齐”(deliberative alignment),来使o3等模型符合其安全原则。

ARC-AGI(通用人工智能抽象与推理语料库)发起者、Keras(用Python编写的高级神经网络API)之父弗朗索瓦·肖莱(Francois Chollet)认为,虽然o3给人留下了深刻印象,是迈向AGI的一个重要里程碑,但并不就是AGI,仍然有相当多非常简单的ARC-AGI-1的任务是o3无法解决的,同时还有迹象表明ARC-AGI-2对o3来说仍极具挑战性,“这表明在不涉及专业知识的情况下,创建对人类来说容易但对人工智能来说不可能的不饱和、有趣的基准仍然是可行的。当创建这样的测试变得完全不可能时,我们将拥有AGI”。



第13天的彩蛋:Plus用户Sora限时(圣诞假期)无限使用



奥特曼宣布,12月下旬,随着圣诞假期的到来,人们从工作中解脱出来,OpenAI的算力将不再紧张,因此将在假期内为所有Plus用户提供无限的Sora访问权限。

在OpenAI连续密集发布的新品中,不难发现,ChatGPT Pro的推出进一步证明了大模型的“烧钱”速度,多模态、定制化、隐私这些“安全易用”相关内容被多次强调,也体现出OpenAI急需通过更强的模型产品来证明自己。








为什么选择Azure OpenAI服务?



微软Azure OpenAI服务可以合规、稳定地提供企业用户使用ChatGPT模型。出于合规角度,国内企业可以选择微软的Azure OpenAI服务来使用接口,并具有以下优势:

  •  效果一致:与OpenAI官方接口效果相同,无需担心性能差异。

  • 国内IP调用:直接使用国内IP,连接更稳定,响应速度更快。

  • 合规发票:符合国内法规,可直接开具专用发票。

  • 灵活计费:按Token使用量计费,用多少付多少,成本可控。

  • 技术支持:微软认证技术团队提供专业支持,解决技术难题。

  • 企业优惠:现在签约,享受企业专属折扣。



作为微软的合作伙伴,领驭科技为企业提供绿色申请通道!企业现在就可以申请 OpenAI o1、GPT-4o 、GPT-4o mini!

↓马上申请免费试用↓


深圳领驭科技有限公司,作为微软中国南区的核心合作伙伴及HK CSP资质持有者,已成为国内首批获得Azure OpenAI服务授权的服务商之一。我司正积极整合Azure OpenAI的强大功能,包括先进的自然语言处理、分析和推理能力,到其产品和行业解决方案中。

Azure OpenAI服务通过其大规模生成式AI模型,支持企业客户根据特定需求和场景,开发创新应用,涵盖辅助写作、代码编写、多媒体内容生成以及数据分析等多个领域,为互联网、游戏、金融、零售、医药等行业以及自动驾驶和智能制造等前沿技术领域带来深远影响。



联系我们


深圳领驭科技有限公司

电话:0755 8654 3872

电邮:marketing@leinwin.com

网址:ai.leinwin.com

地址:深圳市南山区粤海街道高新科技园中区科技中三路5号国人通信大厦A座 902


【声明】内容源于网络
0
0
瀚鹏AI
瀚鹏AI产品体验和最新消息发布。
内容 111
粉丝 0
瀚鹏AI 瀚鹏AI产品体验和最新消息发布。
总阅读133
粉丝0
内容111