

GPT-4.5发布
AI交互新变革,引领人性化新风向


当地时间2月27日,OpenAI重磅推出最新模型GPT-4.5,在人工智能领域激起千层浪。作为OpenAI目前规模最大的模型,GPT-4.5在情商与交互体验上实现了质的飞跃,为用户带来前所未有的新奇感受。

OpenAI研究副总裁Mia Gliese介绍,GPT-4.5具备热情、直观且自然流畅的对话能力,对用户意图的理解更加精准深入。CEO山姆·奥特曼更是盛赞,这是首个能让用户感觉在与有思想的人交流的模型,它给出的建议常常令人惊喜。

在发布会上,GPT-4.5展示了其强大的用户意图理解和情商提升能力。当用户输入“被朋友放鸽子,要发‘恨他们’的短信”时,以往的模型可能只是机械地按要求生成内容,而GPT-4.5则展现出了人性化的一面,它先温柔地安抚用户情绪:“被爽约肯定不好受,先消消气,看看怎么更好处理。”随后给出更具人情味的回复建议,如“这次被放鸽子我很失望,希望以后提前沟通,避免类似情况”,并询问用户是否仍坚持原要求。这种交互方式让用户感受到被理解和尊重,而非单纯的指令执行。

在知识讲述方面,GPT-4.5同样表现卓越。当被问到“海水为何是咸的”,与GPT-4 Turbo等以往模型单纯罗列事实不同,GPT-4.5会以“你知道吗,海水咸味背后有很长的故事”这样富有互动感的语气开场,接着详细解释海水变咸的原因,最后还会进行简洁总结,帮助用户更好地记住关键信息。

对于“用第一性原理解释AI对齐的必要性”这类专业问题,其他模型的回答可能像学术论文般复杂难懂,而GPT-4.5则巧妙地通过“第1步、第2步……”的方式引导用户思考,先解释概念,再逐步分析联系,让用户轻松把握问题本质。

直播中还揭秘了GPT-4.5的开发内幕。它大胆采用低精度训练,在预训练阶段跨多个数据中心完成,计算效率比GPT-4提高了10倍以上,并且将成为未来推理模型的基础。

在发布时间安排上,从发布日起,GPT-4.5率先向每月付费200美元的Pro用户开放,下周将逐步向每月20美元的Plus用户开放。尽管OpenAI称其并非前沿模型,但GPT-4.5在语言交互与理解方面的出色表现,无疑为AI发展开辟了新路径。

在衡量LLM事实准确性的SimpleQA基准测试中,GPT-4.5的准确率达到了62.5%,幻觉率为37.1%,相比GPT-4o、o1、o3mini等有了显著优化。例如面对“第一种语言是什么”这样的问题,它会坦诚地表示这是人类未解之谜,展现出了诚实可靠的一面。

OpenAI开发的新可扩展技术,通过小型模型衍生数据来训练更大更强的模型,大大提升了GPT-4.5的可操控性、细微差别理解及自然对话能力。在人类偏好评估中,测试者明显更青睐GPT-4.5。

不过,GPT-4.5也并非十全十美,其API定价高昂,输入75美元/百万tokens,输出150美元/百万tokens,比GPT-4o高出15-30倍。但据内测博主反馈,其在实际使用中极具创造力,视觉理解能力也十分出色。

值得一提的是,OpenAI的CEO山姆·奥特曼因在医院照顾刚出生的孩子而未出席发布会,此前他已在社交平台分享了初为人父的喜悦。

GPT-4.5的发布为AI领域注入了新的活力,其在情商和交互体验上的突破,有望引领未来AI模型朝着更人性化的方向大步迈进。随着更多用户的体验反馈,我们有理由期待GPT-4.5在实际应用中绽放更多光彩。
END


