>

OpenAI甩出GPT-5.5 Instant！幻觉暴降52%，话少三成，全员免费

>

OpenAI甩出GPT-5.5 Instant！幻觉暴降52%，话少三成，全员免费

OpenAI甩出GPT-5.5 Instant！幻觉暴降52%，话少三成，全员免费

智东西

2026-05-06

3

导读：胡说八道少一半，说话还更“人模人样”了。

胡说八道少一半，对话更自然可靠

作者 | 王涵
编辑 | 冰倩

5月6日，OpenAI正式推出GPT-5.5 Instant版本，将逐步向所有ChatGPT用户推送，取代GPT-5.3 Instant成为默认模型。

该版本优化日常交互体验，对话语气更自然、回答准确率更高且内容更紧凑。个性化功能可智能调用历史对话记录补充背景信息。

Sam Altman在社交媒体强调："速度、智能与个性化能力协同作用，创造了整体大于部分之和的体验。"

内部评估显示，GPT-5.5 Instant在医疗、法律和金融领域的幻觉率降低52.5%，科学图表推理准确率提升6.6%，多模态专家推理准确率提高6.8%。

文档解析错误率降低2.1%（相对降幅14.4%），博士级科学问答准确率提升7.1%，数学竞赛AIME 2025准确率增长15.8%。

API中该模型命名为“chat-latest”。付费用户在三个月过渡期内仍可访问GPT-5.3 Instant。增强个性化功能正面向网页端Plus和Pro用户推出，计划扩展至所有订阅套餐。

部分用户指出：“AIME成绩飞跃表明这是实质性的推理能力升级，而非简单聊天微调。”还有观点认为：“‘更温暖、更简洁’的改进精准回应了用户痛点，本质上是关键性格优化。”

亦有用户期待更实用的功能，部分人表示怀念GPT-4o的性能表现。

图像解析与准确性显著提升

GPT-5.5 Instant强化图像解析及STEM学科问答能力，在用户标注过高错误场景中的不实回答占比降低37.3%。模型可智能判断是否调用网络搜索，提供更精准回复。

以方程求解为例：新版模型能识别用户代数错误并使用求根公式得出正确解，而旧版仅指出解不成立后便错误判定无实数解。

回答简洁性与实用性优化

新版模型回复更加紧凑，在保证温暖感与个性化的同时，字数减少30.2%、行数缩减29.2%。避免过度解释和冗余追问，语气适配工作场景需求。

对比测试显示，GPT-5.5 Instant提供可直接使用的操作脚本，重点围绕问题核心展开；而旧版在非正式咨询场景中结构过于复杂，超出用户实际需求。

个性化记忆功能全面升级

GPT-5.5 Instant可高效调用历史对话、上传文件及Gmail上下文，生成更精准的个性化回复。用户现可查看模型答案所依据的上下文来源，并行使完全管控权。

例如，在旧金山旅游推荐场景中，新版基于历史对话提供本地化建议，而旧版推荐仍显宽泛。用户可删除无关对话记录、编辑已保存记忆或使用临时对话模式，全程保障隐私安全。

结语：体验优化增强用户信任

OpenAI此次升级聚焦交互质量优化：一是在专业知识领域显著降低幻觉率；二是优化回复简洁度与语气表达；三是通过透明化记忆来源建立技术信任基础。

此类"体验型更新"的价值难以通过传统基准完全量化，实际效果将取决于用户的长期使用感受。

【声明】内容源于网络

0

0

智东西

各类跨境出海行业相关资讯

内容 11474

粉丝 0

智东西各类跨境出海行业相关资讯

总阅读113.6k

粉丝0

内容11.5k