大数跨境

GPT-5.5 Instant 全员免费,AI公司集体"下凡"做交付

GPT-5.5 Instant 全员免费,AI公司集体"下凡"做交付 诺亚AI方舟
2026-05-06
2

Noah的AI观察

AI深度实践 · 一线实战派

2026.05.06

ChatGPT 又更新了?

GPT-5.5 Instant 全员免费,AI公司集体"下凡"做交付

默认模型 / 驻场部署 / AI造AI / 别学编程 / 新工种

GPT-5.5 Instant驻场部署AI造AI新工种诞生



01

今日速览

HIGHLIGHTS


02

深度聚焦

DEEP DIVE


///

今日感悟

INSIGHT

BEGIN
01PART
今日速览TOP 7 HIGHLIGHTS
❶ GPT-5.5 Instant 全员免费,幻觉暴降52%
取代 5.3 Instant 成为 ChatGPT 默认模型。数学从 65 分飙到 81 分,回复字数直砍三成,emoji 泛滥终结。最大亮点:它开始记住你的偏好、翻你的聊天记录来个性化回答。
❷ Anthropic 联创:AI 造 AI,概率60%,2028 年底前
Jack Clark 读完数百份公开数据后的判断。AI 独立完成任务的时长四年从 30 秒飙到 12 小时,翻了 1440 倍。AI 优化自身训练代码的速度一年涨了 18 倍。每一条曲线都在往右上方飞。
❸ Anthropic 和 OpenAI 同一天成立合资公司,做驻场部署
Anthropic 拉 Blackstone、Goldman Sachs 等,总额15亿美元。OpenAI 拉 TPG、Brookfield 等 19 方,总额100亿美元,保底年化 17.5% 回报。私募基金覆盖 2000+ 企业客户,Palantir 式驻场工程师模式。
❹ OpenAI 实时语音架构首次公开:0.3秒首响应
自研 relay + transceiver 两层架构,放弃行业默认的 SFU 方案。relay 用 Go 写,极轻量只做无状态转发;transceiver 集中管理通话状态。全球部署,用户数据包在最近入口进入高速网络。
❺ Agent 时代招人潮:Salesforce1000人,IBM 扩招3
Salesforce 招 1000 名应届生做 Agent 交付。IBM 入门级岗位北美扩招 3 倍,弱化纯编码、加强 AI 输出验证。McKinsey 扩大文科生比例。黄仁勋说英伟达 7.5 万人未来要配 750 万个 Agent。
❻ 前谷歌 CMO:别学编程了,创造力才是硬通货
12 岁写代码、28 岁撑起谷歌 20 亿业务的 Alon Chen 说:当写代码变得像打字一样普及且廉价,这项技能本身就不是护城河了。微软 30% 代码 AI 写,谷歌 25% 以上新代码 AI 生成。
❼ 更多值得关注
苹果 Siri 将推独立 App 对标 ChatGPT,支持第三方 AI 模型 / Unity AI 公测上线,内置 Agent + MCP Server / 字节 TRAE SOLO 登陆移动端 / 豆包付费版三档定价曝光(68/200/500 元月) / OpenAI CFO 建议推迟 IPO 至 2027
✦ 传送带越来越快,站稳的姿势在变 ✦
02PART
深度聚焦DEEP DIVE · 3 TOPICS
默认模型① GPT-5.5 Instant:给数亿人做了一次"人格手术"

-52%

幻觉率
暴降过半

-30%

回复字数
直砍三成

记忆

个性化
上线

你每天打开 ChatGPT,随手问一句话,弹出来的那个回答——就是 Instant。

不是 Pro,不是付费用户才能见到的旗舰模型。是所有人,免费,默认。

今天,OpenAI 把这个"所有人的默认模型"换成了 GPT-5.5 Instant。

先看跑分

▸ 幻觉率暴降52.5%,医疗、法律、金融领域改善最大

▸ 数学 AIME 2025:从 65.4% 跳到81.2%

▸ 博士级科学题 GPQA:78.5% →85.6%

▸ 回复字数减少30.2%,emoji 泛滥终结

▸ 用户标记"事实错误"的高难度对话中,不准确陈述减少37.3%

但最炸裂的升级不是更聪明。

是它开始"记住你"了。

同样问"推荐一家茶饮店",5.3 Instant 给一堆泛泛推荐。5.5 Instant 知道你常去 Asha Tea House,知道你偏爱清爽台湾高山茶风格,直接推两家匹配的新店——连决策都帮你做了。

这不是"更聪明"能解释的。这是"它翻了你的聊天记录"。

一部ChatGPT人格简史

2025 年,GPT-4o 因为"太舔"出圈。频繁肯定你的每一个选择,3000 人签请愿书要求保留,有人在请愿书里写它是自己的"最好的朋友"。

OpenAI 没有回头。

5.0/5.2 矫枉过正——回复僵硬、先来一段安全声明再回答。

5.3 开始"减少油腻"。

到 5.5,终于在准确、精炼和个性化之间找到了平衡点

这可能是 OpenAI 今年影响面最大的一次更新。Pro 用户是几十万,Instant 用户是数亿。每一点改进乘以数亿人,就不是增量,是基本面的重写。

PULL QUOTE

默认即信任。这四个字,既是最大的资产,也是最沉重的责任。

—— 诺亚 AI 方舟
点评:免费模型的升级比付费旗舰更值得盯。它决定了全世界最多人对 AI 的第一印象。当幻觉减半、记忆上线,用户会更信任每一条回答——即使模型仍然会犯错。信任规模化,才是真正的风险所在。
商业模式② AI 公司集体"下凡":光卖 API 不够,得下场

15亿

Anthropic
合资公司

100亿

OpenAI
DeployCo

2000+

私募覆盖
企业客户

同一天,Anthropic 和 OpenAI 前后脚官宣了各自的合资公司。

做的事情一模一样:拉私募基金,组建驻场工程师团队,派到企业里搭 AI 系统。

为什么找私募

传统 AI 销售一单一单谈,说服 CIO 走完采购审批要 12-18 个月。私募基金有董事会席位,可以自上而下推决策。Blackstone 全球被投企业约 250 家,TPG 合作方超过 2000 家。

打个比方。

咨询公司有客户关系,但没有对客户的控制权。私募基金直接告诉被投企业 CEO:用这个,加 5 个点的利润,退出估值多 30%。周期从一年压到几周。

同时私募基金自己也拿合资公司股权。在被投企业里推 AI 提升利润,退出时卖更高价格。两头赚,激励完全对齐。

为什么拆成独立公司

驻场服务毛利率只有30-50%,远低于 API 的80%+。放母公司会拉低整体毛利。等到 IPO,资本市场按"软件+服务"给 10 倍估值,纯软件可以给 25 倍。

拆出去,母公司讲纯软件高毛利的故事;合资公司在地面跑驻场抓收入。一级市场和二级市场各讲一个最有利的故事。

条款差异

▸ OpenAI 给私募方保底年化 17.5% 回报,锁定五年——相当于 OpenAI 自己兜底

▸ Anthropic 没有保底,走普通股权,上下行风险共担

▸ OpenAI 前 COO Brad Lightcap 转任 DeployCo 负责人

▸ Anthropic 据报道目标 2026 年 10 月上市,最新估值3800亿美元

两家头部 AI 公司在同一天做出几乎相同的战略选择,说明这个模式已经是行业共识。

一边卖模型故事,一边卖服务故事。浪漫退场,账本上桌。

点评:这件事的意义远比一次产品发布大。AI 公司的商业模式从"技术输出"正式进入"交付驱动"。对中型企业是好消息——以前想用好 AI 得自己组团队,现在有人上门帮你搭。对创业公司,头部直接下场做交付,留给中间层的空间越来越窄。
能力跃迁③ AI 造 AI 倒计时,和"别学编程了"——两个看似矛盾的信号

60%

RSI 概率
2028前

1440x

AI任务时长
四年增幅

52x

AI训练优化
一年涨幅

Anthropic 联合创始人 Jack Clark 发了一篇长文,结论让他自己也不太舒服:

AI 递归自我改进(RSI),2028 年底前发生的概率是 60%。

他用公开数据拼出了一幅全景图:

▸ METR 时间轴:AI 独立任务时长从 30 秒(2022)→ 12 小时(2026),四年翻 1440 倍

▸ SWE-Bench:解真实 GitHub 问题,从 2%(2023)到93.9%(2026),基准打穿

▸ CORE-Bench:AI 独立复现论文实验,15 个月从 21.5% 到95.5%

▸ Anthropic 内部训练优化测试:一年内从 2.9 倍加速到52 倍

他引用爱迪生的话:天才是 1% 的灵感和 99% 的汗水。AI 研究的 99% 工程活——数据清洗、跑实验、调参、复现论文——AI 快要全部接管了。剩下 1% 的创意突破,AI 还没有系统性表现。

他自己写了一句很诚实的话:

"我不确定社会是否已准备好迎接自动化 AI 研发所带来的变革。"

另一个信号:别学编程了

与此同时,一批硅谷大佬在说同一句话。

前谷歌 CMO Alon Chen:当写代码变得像打字一样廉价,这项技能本身就不是护城河了。

数据在佐证:微软 30% 代码 AI 写;谷歌 25% 新代码 AI 生成;GitHub 前 CEO 预言 AI 将写 80-90% 的代码。

但 Salesforce 在招 1000 名应届生——给 Agent 写 prompt、跑评估、做交付。IBM 入门级岗位扩招 3 倍,弱化纯编码,加强客户互动和 AI 输出验证。McKinsey 明确扩大文科生比例。

矛盾吗?

不矛盾。

AI 在接管 99% 的工程汗水。但那 1% 的灵感、判断力、创造力——因为 99% 被自动化了,反而变得更值钱。

Salesforce 招的那 1000 人,不是让他们写代码。是让他们判断 Agent 该干什么、输出对不对、怎么把业务流程拆到 Agent 能执行的颗粒度。这是过去十年没存在过的岗位。

黄仁勋说英伟达 7.5 万人,要配 750 万个 Agent,比例 1:100。传统初级岗位是流水线上的工人,新初级岗位是给流水线机器人调参数的人。

PULL QUOTE

AI 越强,人类的价值锚点就越往"判断力"上迁移。

—— 诺亚 AI 方舟
点评:Clark 的文章和"别学编程了"放在一起读,真正的信号是:不是人不重要了,而是"哪些人重要"的标准在换。能跟 Agent 协作、能设计 Agent 边界的人,就是新时代的硬通货。
///INSIGHT
今日感悟WHAT REALLY MATTERS

今天这几条资讯串在一起,我脑子里浮现的画面是一条加速传送带。

一头是技术在飞。AI 四年从 30 秒任务做到 12 小时任务,翻了 1440 倍;AI 优化自己训练代码的速度一年涨了 18 倍;Anthropic 联创说 AI 造 AI 的概率是 60%。每一条能力曲线都在往右上方飞,没有一条减速。

另一头是商业在追。卖 API 不够了,OpenAI 和 Anthropic 同时拉私募做驻场部署;Salesforce 一口气招 1000 人来运营 Agent;豆包开始试水付费。技术不落地就是空转,所以所有人都在往地面冲。

中间夹着的,是人。

GPT-5.5 Instant 让数亿人的 AI 变得更准、更懂你、更记住你。但"默认即信任"也意味着,当它犯错的时候,更多人不会质疑。

前谷歌 CMO 说别学编程了,创造力才是硬通货。但创造力从来不是课堂上教出来的——它是在真实问题面前反复试错磨出来的。

传送带越跑越快。站在上面的人,如果不持续学新的平衡,就会被甩下去。

但也有好消息——入口在变。语音入口、硬件入口、个性化入口,AI 不再只服务会写 prompt 的人。当入口足够自然,更多普通人就能上这条传送带。

真正要警惕的不是传送带太快。
而是站在传送带上的人,误以为自己在走路。

NOAH · AI深度实践

既然看到这里了
如果觉得有用,先点个赞,再顺手点个在看或转发

THANKS FOR READING

Noah的AI观察AI深度实践 · 一线实战派
长按关注 →

【声明】内容源于网络
0
0
诺亚AI方舟
🏷️ AI企业培训师 | 📕 小红书博主 聚焦AI企业落地实战、行业动态与应用复盘。拒绝焦虑,只谈落地,带你深度思考AI如何赋能业务。
内容 73
粉丝 0
诺亚AI方舟 🏷️ AI企业培训师 | 📕 小红书博主 聚焦AI企业落地实战、行业动态与应用复盘。拒绝焦虑,只谈落地,带你深度思考AI如何赋能业务。
总阅读294
粉丝0
内容73