Agent大战打响！OpenAI发布全新Agent开发工具集！- 大数跨境

汇智智能体

2025-03-12

Agent大战打响！

今日凌晨，OpenAI 首席产品官 Kevin Weil 带领团队进行了技术直播，开源了首个 Agent SDK 以及发布了 Responses API ，助力开发者和企业构建高效、可靠的 AI 智能体。

在今年，ChatGPT 推出了两款智能代理，“Operator”可浏览网页并代用户操作，“Deep Research”能在15分钟内完成相当于一周工作量的研究并生成详细报告，用户反馈良好。

此次 OpenAI 决定将这些功能及更多工具通过 API 开放给开发者，以推动 AI 智能体在各行业的应用。

三大核心工具重塑开发流程

尽管近年来大模型能力显著提升，但开发者在构建生产级AI智能体时仍面临工具分散、协调复杂、安全可控性低等挑战。

OpenAI此次发布的新工具集旨在解决这些问题，通过统一的API接口和开源框架降低开发门槛，让开发者更专注于业务逻辑而非底层整合。

与o1 Pro、Deep Research、Operator不同，Responses API是一个「统一API」，可支持多轮交互和工具调用。

它整合了 Chat Completions API 的对话生成能力与 Assistants API 的外部工具调用功能。开发者通过单次调用即可完成多工具协同任务，例如结合网络搜索、文档检索与计算机操作，解决复杂问题。该 API 还支持流式事件响应和统一的数据存储，便于性能评估。

除此之外， Responses API 自带了三个超实用的工具

Web搜索工具：基于GPT-4o系列模型，实时抓取互联网信息并提供引用来源，在SimpleQA基准测试中准确率达90%，适用于市场分析、旅行规划等场景；

文件搜索工具：支持多格式文档检索，结合元数据过滤与向量存储技术，快速定位企业知识库中的关键信息，如法律案例或技术文档；

计算机使用工具：由CUA（Computer-Using Agent）模型驱动，可模拟人类操作计算机界面（点击、输入等），在OSWorld等测试中表现优异，适用于自动化传统系统任务。

基于去年发布的实验性 Swarm 框架，OpenAI 还推出了开源的 Agents SDK，支持多智能体协作、任务交接与安全控制。开发者可定义角色、配置工具链，并通过可视化监控优化工作流，适用于客户支持、内容生成等场景，大大简化了多 Agent 工作流程的编排。

总的来说，OpenAI发布的 Agent 开发工具集，明显降低了构建AI智能体的门槛，也让更多想法得以轻松实现，可以更加专注于构建真正实用的AI应用。

正如Kevin Weil 在直播最后所说，2025年将会是 AI 智能体爆发的一年，也是 ChatGPT 和我们开发者工具从“仅仅回答问题”升级为“真正能在现实世界里为你执行任务的”一年。

AI Agent 开发时代到来

在过去，AI的角色单纯就是一个工具，比如帮你回答问题、生成文本、处理数据。但现在，OpenAI的 Responses API 和 Agents SDK 让AI具备了更强的自主性。

它不仅能调用多种工具（比如网络搜索、文件检索、模拟人类操作电脑界面），还能在复杂任务中协调多个 Agent 协同工作。这意味着，AI 不再只是“听命行事”，而是能主动规划、执行任务，甚至在不同 Agent 之间交接工作。

早期测试用户已经用这些工具做出了不少实际成果，比如：

Hebbia用Web搜索工具帮助资产管理者提取见解；

Navan将文件搜索工具应用于AI旅行Agent，为用户提供精准的旅行政策答案；

Unify和Luminai用计算机使用工具自动化复杂操作流程；

Box利用Agents SDK快速构建企业级数据搜索应用。

……

这些案例说明，AI Agent 已经在金融、法律、旅行、企业服务等领域展现了实际价值。企业可以用AI Agent优化内部流程，个人可以用它来管理生活事务等。

未来，我们将看到更智能、更实用、更普及的 AI 应用不断涌现，为人们的生活和工作带来更多的便利和创新。

【声明】内容源于网络

汇智智能体

让AI力量成为每个人的天赋！

内容 179

粉丝 0

汇智智能体让AI力量成为每个人的天赋！

总阅读182

粉丝0

内容179