大数跨境

Codex终于能控制浏览器了,这次真有点Agent那味了

Codex终于能控制浏览器了,这次真有点Agent那味了 萝卜AI笔记
2026-05-09
5
导读:Codex 能访问浏览器了~

大家好,我是你们的萝卜哥~


最近 Codex 真的有点猛。


随着 GPT-5.5 发布之后,很多朋友应该都发现了,Codex 的表现越来越稳了。写代码、改项目、处理各种开发任务,已经有点越用越顺手的意思。


更夸张的是,现在 Codex 的周活已经超过 400 万了。


这个增长速度,确实有点吓人。


OpenAI 显然还没打算停下来。


昨天我刷到一个新消息,Codex 又增加了一个非常实用的新能力,它现在可以直接控制 Chrome 浏览器了。

这就有意思了。


以前我们说 Agent,很多时候还停留在它会想、它会写、它会规划


但只要它不能真正进入网页、操作页面、读取信息、处理任务,那总感觉还差最后一口气。


现在 Codex 开始补上这块拼图了。


说人话就是 Codex 不只是在聊天框里帮你想办法,它现在已经能打开浏览器,直接替你干活了。


还说啥,正在用 Codex 的兄弟们可以冲一波了。


萝卜哥已经帮大家先试了一圈,下面直接带大家看看怎么用,以及这个功能到底能做到什么程度。


插件安装

首先在插件页面,找到 Chrome,直接安装。

安装完成后,会引导我们去下载 Chrome 浏览器插件。

下面就是安装浏览器插件即可。

浏览完插件显示是绿色的Connected,就说明安装完成没有问题。

然后我们在电脑控制页面,还能管理该插件的各种信息。

这些权限大家根据自己的偏好去设置就好。

对于 Codex 的 Chrome 插件,是可以多个 tab 后台并行工作的,也就是说不会抢占我们的电脑操作权限。


也就是说在它干活的时候,我们可以继续自己的工作,两者互不干扰。这和传统的 AI 浏览器插件可不一样,以前的这些插件在干活的时候,我们只能等着,一会是鼠标被抢占了,一会是键盘被占用了,很耗时间


不得不说,还得是 OpenAI 啊,一出手就能解决大家最大的痛点。


一个小测试

光说没用,还是得试。


下面来做一个真实案例,我让 Codex 帮我批量下次一个热搜网站的数据。

先来测试一天的数据,看看能不能正常获取。


可以看到确实能正常获取,而且数据准确。

接下来再让它把历史数据抓下来放到文件当中。

可以看到抓取的情况还是非常准确的,速度也非常快。

只不过 URL 并不是我们想要的,所以我又让它试试能不能抓取浏览器开发者工具里面的数据,没想到竟然也能行,这个真的惊喜啊。

好了,到这里我们的测试就结束,接下来就是让它把历史数据都抓取给我们了,然后我们就可以去睡觉了,等明天来收货,完美~

整个过程下来,确实有点像找了一个临时数据助理。


你把任务讲清楚,它自己打开网页、自己看页面、自己处理数据、自己生成文件。


最关键的是,你不用一直盯着。


这才是我觉得有价值的地方。


很多 AI 工具最怕的就是看起来很智能,实际每一步都要你守着。


但这次的 Codex,你交代一件事,然后可以暂时走开,回来直接看结果就行。


它能不能百分百完成复杂任务先不说,至少在这类网页数据处理场景里,已经有很强的可用性了。


不过对于这种需求完全访问计算机的场景,OpenAI 目前似乎也在探索各种限制,比如我就发现任务在执行的过程中会出现下面的提示,要求 KYC 认证,有点难受啊,这块后面有机会单独来写一篇吧~


这个功能适合用来做什么

最后再来说说这个控制浏览器的功能,我们都能用来做什么,我简单给大家分一下。


推荐:


第一,自己系统的压力测试、功能测试、日常测试。


比如你有一个后台系统,需要反复点页面、填表单、检查结果,这类任务非常适合让 Codex 辅助完成。


第二,繁杂的表格填写和信息处理。


有些网页操作没什么技术含量,但就是耗时间。


一个个点、一个个复制、一个个整理,人做久了真的很烦。


这种活交给 AI,很合理。


第三,适当的公开网站数据抓取和信息分析。


比如做选题、做市场观察、做公开信息整理,这类轻量数据处理也可以尝试。


但前提是别过度,别影响别人服务,也别拿它干不该干的事。


不推荐:


这里萝卜哥必须多说几句。


我不建议大家用它去自动化运营自媒体账号,包括公众号、小红书、X 等平台。


尤其是批量发布、批量评论、批量互动、批量私信这种事情,真的没必要。


我一直不太理解,为什么有些人总想着把自媒体做成一个全自动流水线。


咱们是忙到连一点真诚表达的时间都没有了吗?还是账号多到自己已经完全管不过来了?


任何平台都不会希望系统里到处都是批量生成、批量发布、批量互动的 AI 内容。


读者也不傻,一篇内容有没有用心,其实大家都能感觉到。


AI 可以辅助我们整理资料、提高效率、减少重复劳动。


但内容这件事,最后还是要有人味。


尤其是自媒体。


你可以用 AI 找资料,可以用 AI 做提纲,可以用 AI 帮你润色,但观点、判断、体验、情绪、分寸感,最好还是自己来。


别让工具替你完成表达。


更不要用批量、频繁,甚至带攻击属性的方式去访问别人的服务。


这种事短期看像是占便宜,长期看一定会反噬自己。


写在最后

这次 Codex 控制 Chrome 的能力,我觉得是一个很值得关注的信号。


它说明 AI Agent 正在从“会回答问题”,慢慢走向“能进入真实工作流”。


以前我们用 AI,更多是在对话框里来回问答。


现在它开始能打开浏览器、读取网页、处理数据、生成文件,甚至能在后台自己跑任务。


这一步很关键。


因为真正能改变效率的工具,往往不是多会聊天,而是能不能替你把那些重复、琐碎、耗时间的事情接过去。


当然,它现在还没有完美。


复杂任务依然需要检查,涉及账号、权限、隐私和平台规则的事情,也一定要谨慎。


但方向已经很清楚了,以后我们可能会越来越少地亲手点开一个又一个网页,复制一段又一段内容,整理一份又一份表格。


这些活,AI 会慢慢接过去。


而我们真正需要做的,是把任务讲清楚,把边界设清楚,把结果判断清楚。


工具越强,人越要知道自己该做什么。


未来的工作流,大概率不是人追着工具跑,应该是人把方向定好,让工具自己去跑。


感兴趣的兄弟,可以去试试 Codex 的 Chrome 插件。


这东西现在看起来只是一个新功能,但说不定再过一段时间,它就会变成很多人每天离不开的工作入口。



以上就是今天的分享,觉得有帮助,帮请帮一键三连:点赞、转发,再看留言,你的反馈对我很重要!


【声明】内容源于网络
0
0
萝卜AI笔记
做有温度的AI人
内容 168
粉丝 1
萝卜AI笔记 做有温度的AI人
总阅读5.1k
粉丝1
内容168