大数跨境

实测更新后的GPT Codex:能后台挂机搓软件,但离无脑干活还差一口气

实测更新后的GPT Codex:能后台挂机搓软件,但离无脑干活还差一口气 我的Ai笔记
2026-04-22
8
导读:OpenAI 凌晨更新后的 Codex 竟然能接管Mac甚至盯着屏幕看,实测下来到底是全能外包还是半成品实习生?

点击蓝字,关注我们


天下大事奥皮带机佛牌觉得富婆i阿娇苏东坡放假啊跑i警方跑商的警方破案伺机待发破解批发哦记得粕发酵富婆十九分


图片
这是我的第422篇Ai笔记,本篇1753、累计笔记721361


引言.


OpenAI 的新版 Codex 昨天(4月21日)凌晨又更新了,这次动静不小。




前几天(4月17日)刚看到它拿到了接管 Mac 电脑、点鼠标的权限,昨天凌晨又补齐了最关键的拼图——Chronicle(屏幕记忆)。现在它不仅能动鼠标,还能盯着屏幕看。关键是,这些能力直接对免费用户开放。


这种节奏,感觉 Agent 时代被直接推到了家门口


思考.

有一说一,这次 Codex 的更新,嗅觉极其灵敏,甚至有点激进。




如果你关注过最近开源界最火的几个项目,比如主打全流程自动化的 OpenClaw,或者是专攻极速推理执行的 Hermes,你会发现 OpenAI 这次的落脚点和它们不谋而合。


大家都在意识到一件事:对话框已经成了 AI 进化的枷锁


以前我们把 AI 当成一个懂王,有问题问它,它负责查资料回短信。但这太慢了。




OpenClaw 追求的是直接接管浏览器和桌面,而 Hermes 强调的是模型在执行动作时的确定性


OpenAI 这次把 Chronicle 塞进 Codex,本质上是把感知层从文本框直接下放到了显存层。它不再需要你解释这儿报错了里的这儿是什么意思,它自己能从屏幕 OCR 里读出来。




这其实就是一种动作预判。


当 Codex 开始免费提供 GPT的顶级模型时,它卖的已经不是智力,而是权限。它在赌,比起让用户学会写高级 Prompt,直接让 AI 站在用户背后看屏幕、控终端、刷 GitHub 评审,才是真正让 AI 跑起来的终极形态。


AI+.


为了看看它到底有多少斤两,我直接在 Mac 上把它跑了起来,测了日常最容易遇到的四个场景。


实测一:直接看屏幕找 Bug(Chronicle 屏幕记忆)


昨天凌晨刚上的大招,号称能直接看懂屏幕。实测下来,情况有点拉胯




本以为它一眼就能看懂代码哪里飘红,结果实际操作中,不仅需要来回反复引导,中间还要经历好几个确认步骤。




一路折腾下来,最后给出的修改结果也差强人意。完全没有官方演示里一次过关的爽快感。 




实测二:接管电脑桌面干活(Computer Use)


让它自己点鼠标改代码。




前提条件是必须提前装好两个前置插件,并配置好桌面识别系统。


原以为全副武装后就能当甩手掌柜,但一上手就发现它的桌面理解能力有很大问题。




它经常找不准窗口,或者点错位置,操作起来像个刚学会用鼠标的新手。要想让它熟练操作私人电脑里的各个软件,估计还得靠海量的日常任务来喂它的肌肉记忆。


实测三:代码配图一把抓(混合生成)


搓带图的网页 Demo,单张配图的质量确实很高,直接嵌进代码里很顺滑。




但也暴露出一个小缺陷:如果要求它生成一整套系列配图,要求图与图之间有明显的区分度,它目前还做不到。




给出的几张图长得极其相似,同质化相对严重。对视觉要求比较高的朋友,这一块目前还是得靠人工去微调,不过这也因人而异。


实测四:丢到后台全自动挂机(长线任务)


这是本次测试中最让人惊喜的一环。




我给它布置了一个开发卡牌软件的长线任务,直接把它扔在后台,跑去干别的事。




它硬是自己默默运行了 3 个小时,一步步把卡牌成品的软件给完整敲出来了。中间不需要人盯着,算是真正展现出了 Agent 自动化的潜能。


祛魅与吐槽.


一圈跑下来,发现 Codex 离网传的彻底颠覆还有段距离。


它的上限确实很高,但动手能力依然是个半成品。屏幕记忆经常卡壳,理解不了太复杂的报错界面;接管电脑听起来很酷,目前还得装插件伺候,操作起来跌跌撞撞。如果是冲着完全释放双手去用,目前肯定会失望。它现在更像是一个智商奇高、但动作笨拙的实习生,遇到精细活还是得人手把手教。


三句话.


结合刚才这一圈的实测体验,关于这次进化后的 Codex 到底是个什么段位,最后照例留三句话:


1.现在的 Codex 说白了,就是一个能直接连着 ChatGPT 干活的桌面端。不用费劲折腾复杂的 API,只要在官方计划里,开箱就能跑。




2.它的高智商大脑和半成品操作目前十分割裂。日常最舒服的用法就是扬长避短,把它当个不知疲倦的后台打工人,扔些耗时长的代码重活让它自己跑,或者专门用来快速生图和搓 Demo。


3. 从这次急匆匆的更新也能看出来,OpenAI 确实着急了。眼看市面上各种接管电脑的工具满天飞,官方干脆带着顶配模型亲自下场卷桌面端 Agent。虽然现在手脚还不够麻利,但巨头一旦开启肉搏战,以后的电脑桌面肯定有一场大戏,咱们拭目以待。


彩蛋.


这次 Codex 的配置确实有点繁琐,特别是 Computer Use 需要用到的几个前置插件和环境配置。我整理了一份保姆级的《Codex 桌面接管与环境配置实操手册》




老规矩,后台回复「手册」,直接拿走。

【声明】内容源于网络
0
0
我的Ai笔记
很干货、有深度、真免费,关注“我的Ai笔记”,每天学Ai技巧! 赋能客户、助力普通人在Ai时代抢占先机。
内容 371
粉丝 1
我的Ai笔记 很干货、有深度、真免费,关注“我的Ai笔记”,每天学Ai技巧! 赋能客户、助力普通人在Ai时代抢占先机。
总阅读5.1k
粉丝1
内容371