昨晚失眠。
大概是两点半?或者三点。
爬起来翻推特,看到 OpenAI 那个光头又发了个莫名其妙的单词。
紧接着,我的开发者群就开始炸锅。
说是 GPT-5.1 的 Codex-Max 版本偷跑了,或者说,灰度测试?不管叫什么吧,反正有人搞到了接口。
我没忍住。
哪怕明天还要早起搬砖,我也必须得爬起来测一下。
先来看个最直观的感受。
以前我们用 AI 写代码,那是“抽卡”。
你得求着它,把 Prompt 写得像法律文书一样严谨,还得祈祷它别给你凭空捏造个不存在的库函数。
但这回,这货给我的感觉是:
它懂你。
我直接把那个报错了两天、逻辑乱成一锅粥的项目文件丢给它。
注意,这里是整个文件夹。
仅仅过了十几秒。
它没有给我扔回来一段代码片段,而是直接还给了我一个重构后的完整架构。
而且。
它还很贴心地写了个备注:“我看你原来的逻辑里,多线程处理那块有点冗余,顺手帮你优化了,不用谢哈。”
说实话,那一刻我有点脊背发凉。
那种感觉,不是惊喜。
是惊悚。
说回这个模型本身。
简单来说,这个 5.1 版本,专门针对代码逻辑做了极端的强化。
它不再是像以前那样,根据上文猜下文。
它是真的在“思考”整个系统的运作方式。
我又测了一下更刁钻的。
故意写了一段带死循环且变量名全是 a, b, c 的垃圾代码,问它这代码是干嘛的。
它居然精准地识别出了我的意图,并且嘲讽了一句(我脑补的):
“虽然写的很烂,但这应该是一个简易的库存管理系统。”
紧接着,啪啪啪给出了三个优化方案。
方案一,保性能但牺牲可读性;方案二,平衡且稳健;方案三,为了炫技。
我选了方案二。
运行,0 报错。
十分丝滑。
这让我想到前两天看的一个新闻,说是现在的程序员越来越像产品经理了。
当时我还嗤之以鼻。
现在看来。
确实如此。
当工具强到一定程度,门槛就不在技术本身,而在于想法。
有点扯远了,继续说回这个 GPT-5.1-Codex-Max。
除了强,还有一个特点:
贵,是真的贵啊。
跑一次复杂任务消耗的 Token,够我喝好几杯 9.9瑞幸了。
但你想想,它这一分钟干的活,可能顶你甚至一个初级外包团队干三天的。
这笔账,怎么算都划算。
如果你是搞开发的,或者正准备学编程。
我真心建议。
别再去死记硬背那些语法了。
去学怎么提问,去学怎么设计系统,去学怎么鉴赏代码的美丑。
因为脏活累活。
它都能干。
而且干得比你好。
当然,它也不是完美的。
在我让它写一段涉及到非常偏门的加密算法时,它还是胡说八道了一通。
一本正经地调用了一个根本不存在的库。
那种熟悉的“幻觉”味儿又出来了,让人忍不住想笑。
还好,它终究还是个 AI,不是神。
测完这时候天已经亮了。
看着窗外发白的天空,我突然有点恍惚。
我们总在担心 AI 会取代程序员。
其实,AI 取代的从来不是“写代码的人”。
它取代的是“只会写代码的人”。
有了 GPT-5.1-Codex-Max 这种级别的工具,以后的编程,可能更像是在玩乐高。
积木块它都给你造好了,打磨得光滑锃亮。
你要做的。
是那个拥有最终构思和审美的人。
去决定搭一座城堡,还是一艘飞船。
这么一想,好像也没那么焦虑了。
毕竟。
工具再强,也就是把铲子。
挖出金矿还是挖个坑把自己埋了。
还得看握着铲子的那双手,是你的,还是我的。
GPT-5.1-Codex-Max目前适用于拥有 Plus、Pro、Business、Edu 和 Enterprise 订阅的 ChatGPT 用户。此外,API 也计划很快发布
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。

