大数跨境
0
0

Agent大战打响!OpenAI发布全新Agent开发工具集!

Agent大战打响!OpenAI发布全新Agent开发工具集! 汇智智能体
2025-03-12
2
Agent大战打响!
今日凌晨,OpenAI 首席产品官 Kevin Weil 带领团队进行了技术直播,开源了首个 Agent SDK 以及发布了 Responses API ,助力开发者和企业构建高效、可靠的 AI 智能体。
在今年,ChatGPT 推出了两款智能代理,“Operator”可浏览网页并代用户操作,“Deep Research”能在15分钟内完成相当于一周工作量的研究并生成详细报告,用户反馈良好。
此次 OpenAI 决定将这些功能及更多工具通过 API 开放给开发者,以推动 AI 智能体在各行业的应用。

三大核心工具重塑开发流程

尽管近年来大模型能力显著提升,但开发者在构建生产级AI智能体时仍面临工具分散、协调复杂、安全可控性低等挑战。

OpenAI此次发布的新工具集旨在解决这些问题,通过统一的API接口和开源框架降低开发门槛,让开发者更专注于业务逻辑而非底层整合。

与o1 Pro、Deep Research、Operator不同,Responses API是一个「统一API」,可支持多轮交互和工具调用。

它整合了 Chat Completions API 的对话生成能力与 Assistants API 的外部工具调用功能。开发者通过单次调用即可完成多工具协同任务,例如结合网络搜索、文档检索与计算机操作,解决复杂问题。该 API 还支持流式事件响应和统一的数据存储,便于性能评估。

除此之外, Responses API 自带了三个超实用的工具

Web搜索工具:基于GPT-4o系列模型,实时抓取互联网信息并提供引用来源,在SimpleQA基准测试中准确率达90%,适用于市场分析、旅行规划等场景;

文件搜索工具:支持多格式文档检索,结合元数据过滤与向量存储技术,快速定位企业知识库中的关键信息,如法律案例或技术文档;

计算机使用工具:由CUA(Computer-Using Agent)模型驱动,可模拟人类操作计算机界面(点击、输入等),在OSWorld等测试中表现优异,适用于自动化传统系统任务。

基于去年发布的实验性 Swarm 框架,OpenAI 还推出了开源的 Agents SDK,支持多智能体协作、任务交接与安全控制。开发者可定义角色、配置工具链,并通过可视化监控优化工作流,适用于客户支持、内容生成等场景,大大简化了多 Agent 工作流程的编排。

总的来说,OpenAI发布的 Agent 开发工具集,明显降低了构建AI智能体的门槛,也让更多想法得以轻松实现,可以更加专注于构建真正实用的AI应用。

正如Kevin Weil 在直播最后所说,2025年将会是 AI 智能体爆发的一年,也是 ChatGPT 和我们开发者工具从“仅仅回答问题”升级为“真正能在现实世界里为你执行任务的”一年。

AI Agent 开发时代到来

在过去,AI的角色单纯就是一个工具,比如帮你回答问题、生成文本、处理数据。但现在,OpenAI的 Responses API 和 Agents SDK 让AI具备了更强的自主性。

它不仅能调用多种工具(比如网络搜索、文件检索、模拟人类操作电脑界面),还能在复杂任务中协调多个 Agent 协同工作。这意味着,AI 不再只是“听命行事”,而是能主动规划、执行任务,甚至在不同 Agent 之间交接工作。

早期测试用户已经用这些工具做出了不少实际成果,比如:

Hebbia用Web搜索工具帮助资产管理者提取见解;

Navan将文件搜索工具应用于AI旅行Agent,为用户提供精准的旅行政策答案;

Unify和Luminai用计算机使用工具自动化复杂操作流程;

Box利用Agents SDK快速构建企业级数据搜索应用。

……

这些案例说明,AI Agent 已经在金融、法律、旅行、企业服务等领域展现了实际价值。企业可以用AI Agent优化内部流程,个人可以用它来管理生活事务等。

未来,我们将看到更智能、更实用、更普及的 AI 应用不断涌现,为人们的生活和工作带来更多的便利和创新。


【声明】内容源于网络
0
0
汇智智能体
让AI力量成为每个人的天赋!
内容 179
粉丝 0
汇智智能体 让AI力量成为每个人的天赋!
总阅读182
粉丝0
内容179