1月23日,OpenAI发布了一款全新AI代理工具——Operator,这是一种具备独立完成任务能力的智能代理。
与传统AI不同,Operator能够通过内置浏览器在网页上执行操作,如点击、滚动、填写表单等,为用户提供更加便捷的自动化体验。
Operator的推出标志着AI从被动工具向主动数字化助手的跨越。
无论是填写表格、订购杂货,还是创建趣味模因,Operator 都能高效处理各种重复性任务。
这种能力让人们在日常事务中节省时间,同时也为企业开辟了新的客户互动场景,提高运营效率和转化率。
Operator由全新的“计算机使用代理”(Computer-Using Agent, CUA)模型驱动。
CUA结合了GPT-4的视觉处理能力和强化学习推理技术,可以直接与网页上的图形用户界面(GUI)交互。
通过“查看”网页截图和“操作”鼠标、键盘,Operator无需额外的API集成便可独立完成任务。
同时,Operator还具备自我纠错功能,如果遇到困难,可以请求用户协助,确保使用过程流畅、高效。
Operator支持高度个性化的工作流定制,用户可以为所有网站或特定平台设置偏好,例如在旅行预订网站选择首选航空公司。
此外,用户可以保存常用指令以便快捷访问,并同时运行多个任务,例如在Hipcamp上预订营地的同时,在Etsy上定制个性化商品。
为了进一步优化用户体验,Operator允许用户随时接管操作,特别是在需要登录、输入支付信息或解决验证码时,确保安全性和可控性。
目前,Operator已与多家行业领先企业(如DoorDash、Instacart、Uber等)合作,共同探索实际应用场景。
在公共部门,Operator还与地方政府合作,通过自动化服务提高居民获取城市服务的效率和便利性。
Operator现阶段仅向美国的Pro用户开放,未来将扩展至Plus、Team和Enterprise用户,并逐步整合至ChatGPT平台中。

ChatU可免费申请试用,支持企业私有部署,多引擎AIGC操作系统安全稳定,点击下方公众号一键试用!