
Noah的AI观察
AI深度实践 · 一线实战派
ChatGPT 又更新了?
GPT-5.5 Instant 全员免费,AI公司集体"下凡"做交付
默认模型 / 驻场部署 / AI造AI / 别学编程 / 新工种
01
今日速览
HIGHLIGHTS
02
深度聚焦
DEEP DIVE
///
今日感悟
INSIGHT
取代 5.3 Instant 成为 ChatGPT 默认模型。数学从 65 分飙到 81 分,回复字数直砍三成,emoji 泛滥终结。最大亮点:它开始记住你的偏好、翻你的聊天记录来个性化回答。
Jack Clark 读完数百份公开数据后的判断。AI 独立完成任务的时长四年从 30 秒飙到 12 小时,翻了 1440 倍。AI 优化自身训练代码的速度一年涨了 18 倍。每一条曲线都在往右上方飞。
Anthropic 拉 Blackstone、Goldman Sachs 等,总额15亿美元。OpenAI 拉 TPG、Brookfield 等 19 方,总额100亿美元,保底年化 17.5% 回报。私募基金覆盖 2000+ 企业客户,Palantir 式驻场工程师模式。
自研 relay + transceiver 两层架构,放弃行业默认的 SFU 方案。relay 用 Go 写,极轻量只做无状态转发;transceiver 集中管理通话状态。全球部署,用户数据包在最近入口进入高速网络。
Salesforce 招 1000 名应届生做 Agent 交付。IBM 入门级岗位北美扩招 3 倍,弱化纯编码、加强 AI 输出验证。McKinsey 扩大文科生比例。黄仁勋说英伟达 7.5 万人未来要配 750 万个 Agent。
12 岁写代码、28 岁撑起谷歌 20 亿业务的 Alon Chen 说:当写代码变得像打字一样普及且廉价,这项技能本身就不是护城河了。微软 30% 代码 AI 写,谷歌 25% 以上新代码 AI 生成。
苹果 Siri 将推独立 App 对标 ChatGPT,支持第三方 AI 模型 / Unity AI 公测上线,内置 Agent + MCP Server / 字节 TRAE SOLO 登陆移动端 / 豆包付费版三档定价曝光(68/200/500 元月) / OpenAI CFO 建议推迟 IPO 至 2027
-52%
幻觉率
暴降过半
-30%
回复字数
直砍三成
记忆
个性化
上线
你每天打开 ChatGPT,随手问一句话,弹出来的那个回答——就是 Instant。
不是 Pro,不是付费用户才能见到的旗舰模型。是所有人,免费,默认。
今天,OpenAI 把这个"所有人的默认模型"换成了 GPT-5.5 Instant。
先看跑分
▸ 幻觉率暴降52.5%,医疗、法律、金融领域改善最大
▸ 数学 AIME 2025:从 65.4% 跳到81.2%
▸ 博士级科学题 GPQA:78.5% →85.6%
▸ 回复字数减少30.2%,emoji 泛滥终结
▸ 用户标记"事实错误"的高难度对话中,不准确陈述减少37.3%
但最炸裂的升级不是更聪明。
是它开始"记住你"了。
同样问"推荐一家茶饮店",5.3 Instant 给一堆泛泛推荐。5.5 Instant 知道你常去 Asha Tea House,知道你偏爱清爽台湾高山茶风格,直接推两家匹配的新店——连决策都帮你做了。
这不是"更聪明"能解释的。这是"它翻了你的聊天记录"。
一部ChatGPT人格简史
2025 年,GPT-4o 因为"太舔"出圈。频繁肯定你的每一个选择,3000 人签请愿书要求保留,有人在请愿书里写它是自己的"最好的朋友"。
OpenAI 没有回头。
5.0/5.2 矫枉过正——回复僵硬、先来一段安全声明再回答。
5.3 开始"减少油腻"。
到 5.5,终于在准确、精炼和个性化之间找到了平衡点。
这可能是 OpenAI 今年影响面最大的一次更新。Pro 用户是几十万,Instant 用户是数亿。每一点改进乘以数亿人,就不是增量,是基本面的重写。
PULL QUOTE
默认即信任。这四个字,既是最大的资产,也是最沉重的责任。

15亿
Anthropic
合资公司
100亿
OpenAI
DeployCo
2000+
私募覆盖
企业客户
同一天,Anthropic 和 OpenAI 前后脚官宣了各自的合资公司。
做的事情一模一样:拉私募基金,组建驻场工程师团队,派到企业里搭 AI 系统。
为什么找私募
传统 AI 销售一单一单谈,说服 CIO 走完采购审批要 12-18 个月。私募基金有董事会席位,可以自上而下推决策。Blackstone 全球被投企业约 250 家,TPG 合作方超过 2000 家。
打个比方。
咨询公司有客户关系,但没有对客户的控制权。私募基金直接告诉被投企业 CEO:用这个,加 5 个点的利润,退出估值多 30%。周期从一年压到几周。
同时私募基金自己也拿合资公司股权。在被投企业里推 AI 提升利润,退出时卖更高价格。两头赚,激励完全对齐。
为什么拆成独立公司
驻场服务毛利率只有30-50%,远低于 API 的80%+。放母公司会拉低整体毛利。等到 IPO,资本市场按"软件+服务"给 10 倍估值,纯软件可以给 25 倍。
拆出去,母公司讲纯软件高毛利的故事;合资公司在地面跑驻场抓收入。一级市场和二级市场各讲一个最有利的故事。
条款差异
▸ OpenAI 给私募方保底年化 17.5% 回报,锁定五年——相当于 OpenAI 自己兜底
▸ Anthropic 没有保底,走普通股权,上下行风险共担
▸ OpenAI 前 COO Brad Lightcap 转任 DeployCo 负责人
▸ Anthropic 据报道目标 2026 年 10 月上市,最新估值3800亿美元
两家头部 AI 公司在同一天做出几乎相同的战略选择,说明这个模式已经是行业共识。
一边卖模型故事,一边卖服务故事。浪漫退场,账本上桌。
60%
RSI 概率
2028前
1440x
AI任务时长
四年增幅
52x
AI训练优化
一年涨幅
Anthropic 联合创始人 Jack Clark 发了一篇长文,结论让他自己也不太舒服:
AI 递归自我改进(RSI),2028 年底前发生的概率是 60%。
他用公开数据拼出了一幅全景图:
▸ METR 时间轴:AI 独立任务时长从 30 秒(2022)→ 12 小时(2026),四年翻 1440 倍
▸ SWE-Bench:解真实 GitHub 问题,从 2%(2023)到93.9%(2026),基准打穿
▸ CORE-Bench:AI 独立复现论文实验,15 个月从 21.5% 到95.5%
▸ Anthropic 内部训练优化测试:一年内从 2.9 倍加速到52 倍
他引用爱迪生的话:天才是 1% 的灵感和 99% 的汗水。AI 研究的 99% 工程活——数据清洗、跑实验、调参、复现论文——AI 快要全部接管了。剩下 1% 的创意突破,AI 还没有系统性表现。
他自己写了一句很诚实的话:
"我不确定社会是否已准备好迎接自动化 AI 研发所带来的变革。"
另一个信号:别学编程了
与此同时,一批硅谷大佬在说同一句话。
前谷歌 CMO Alon Chen:当写代码变得像打字一样廉价,这项技能本身就不是护城河了。
数据在佐证:微软 30% 代码 AI 写;谷歌 25% 新代码 AI 生成;GitHub 前 CEO 预言 AI 将写 80-90% 的代码。
但 Salesforce 在招 1000 名应届生——给 Agent 写 prompt、跑评估、做交付。IBM 入门级岗位扩招 3 倍,弱化纯编码,加强客户互动和 AI 输出验证。McKinsey 明确扩大文科生比例。
矛盾吗?
不矛盾。
AI 在接管 99% 的工程汗水。但那 1% 的灵感、判断力、创造力——因为 99% 被自动化了,反而变得更值钱。
Salesforce 招的那 1000 人,不是让他们写代码。是让他们判断 Agent 该干什么、输出对不对、怎么把业务流程拆到 Agent 能执行的颗粒度。这是过去十年没存在过的岗位。
黄仁勋说英伟达 7.5 万人,要配 750 万个 Agent,比例 1:100。传统初级岗位是流水线上的工人,新初级岗位是给流水线机器人调参数的人。
PULL QUOTE
AI 越强,人类的价值锚点就越往"判断力"上迁移。

今天这几条资讯串在一起,我脑子里浮现的画面是一条加速传送带。
一头是技术在飞。AI 四年从 30 秒任务做到 12 小时任务,翻了 1440 倍;AI 优化自己训练代码的速度一年涨了 18 倍;Anthropic 联创说 AI 造 AI 的概率是 60%。每一条能力曲线都在往右上方飞,没有一条减速。
另一头是商业在追。卖 API 不够了,OpenAI 和 Anthropic 同时拉私募做驻场部署;Salesforce 一口气招 1000 人来运营 Agent;豆包开始试水付费。技术不落地就是空转,所以所有人都在往地面冲。
中间夹着的,是人。
GPT-5.5 Instant 让数亿人的 AI 变得更准、更懂你、更记住你。但"默认即信任"也意味着,当它犯错的时候,更多人不会质疑。
前谷歌 CMO 说别学编程了,创造力才是硬通货。但创造力从来不是课堂上教出来的——它是在真实问题面前反复试错磨出来的。
传送带越跑越快。站在上面的人,如果不持续学新的平衡,就会被甩下去。
但也有好消息——入口在变。语音入口、硬件入口、个性化入口,AI 不再只服务会写 prompt 的人。当入口足够自然,更多普通人就能上这条传送带。
而是站在传送带上的人,误以为自己在走路。

NOAH · AI深度实践
既然看到这里了
如果觉得有用,先点个赞,再顺手点个在看或转发
THANKS FOR READING

