
胡说八道少一半,对话更自然可靠
作者 | 王涵
编辑 | 冰倩
5月6日,OpenAI正式推出GPT-5.5 Instant版本,将逐步向所有ChatGPT用户推送,取代GPT-5.3 Instant成为默认模型。
该版本优化日常交互体验,对话语气更自然、回答准确率更高且内容更紧凑。个性化功能可智能调用历史对话记录补充背景信息。
Sam Altman在社交媒体强调:"速度、智能与个性化能力协同作用,创造了整体大于部分之和的体验。"
内部评估显示,GPT-5.5 Instant在医疗、法律和金融领域的幻觉率降低52.5%,科学图表推理准确率提升6.6%,多模态专家推理准确率提高6.8%。
文档解析错误率降低2.1%(相对降幅14.4%),博士级科学问答准确率提升7.1%,数学竞赛AIME 2025准确率增长15.8%。
API中该模型命名为“chat-latest”。付费用户在三个月过渡期内仍可访问GPT-5.3 Instant。增强个性化功能正面向网页端Plus和Pro用户推出,计划扩展至所有订阅套餐。
部分用户指出:“AIME成绩飞跃表明这是实质性的推理能力升级,而非简单聊天微调。”还有观点认为:“‘更温暖、更简洁’的改进精准回应了用户痛点,本质上是关键性格优化。”
亦有用户期待更实用的功能,部分人表示怀念GPT-4o的性能表现。
图像解析与准确性显著提升
GPT-5.5 Instant强化图像解析及STEM学科问答能力,在用户标注过高错误场景中的不实回答占比降低37.3%。模型可智能判断是否调用网络搜索,提供更精准回复。
以方程求解为例:新版模型能识别用户代数错误并使用求根公式得出正确解,而旧版仅指出解不成立后便错误判定无实数解。
回答简洁性与实用性优化
新版模型回复更加紧凑,在保证温暖感与个性化的同时,字数减少30.2%、行数缩减29.2%。避免过度解释和冗余追问,语气适配工作场景需求。
对比测试显示,GPT-5.5 Instant提供可直接使用的操作脚本,重点围绕问题核心展开;而旧版在非正式咨询场景中结构过于复杂,超出用户实际需求。
个性化记忆功能全面升级
GPT-5.5 Instant可高效调用历史对话、上传文件及Gmail上下文,生成更精准的个性化回复。用户现可查看模型答案所依据的上下文来源,并行使完全管控权。
例如,在旧金山旅游推荐场景中,新版基于历史对话提供本地化建议,而旧版推荐仍显宽泛。用户可删除无关对话记录、编辑已保存记忆或使用临时对话模式,全程保障隐私安全。
结语:体验优化增强用户信任
OpenAI此次升级聚焦交互质量优化:一是在专业知识领域显著降低幻觉率;二是优化回复简洁度与语气表达;三是通过透明化记忆来源建立技术信任基础。
此类"体验型更新"的价值难以通过传统基准完全量化,实际效果将取决于用户的长期使用感受。


