洞见畏来

2025-08-10

导读：本周AI圈可谓是“雷声大雨点也大”，OpenAI的GPT-5正式登场，却引发了史上最大规模的用户反弹；国产模型Qwen3悄悄搞了个大新闻，直接把上下文窗口拉到100万token；开源社区更是吵翻了天

哈喽，各位AI圈的小伙伴们～本周AI圈可谓是“雷声大雨点也大”，OpenAI的GPT-5正式登场，却引发了史上最大规模的用户反弹；国产模型Qwen3悄悄搞了个大新闻，直接把上下文窗口拉到100万token；开源社区更是吵翻了天…… 话不多说，一起来看看这波热闹背后的干货吧！

一、🌟 GPT-5登场：风光无限还是麻烦不断？

OpenAI本周正式推出GPT-5，号称“统一体验”，却差点把用户“送走”。这场发布大戏，槽点和亮点一样多——

1. 先说争议：用户怒了，OpenAI连夜改方案

“一刀切”惹众怒：GPT-5上线时直接取消了手动选择模型的功能，还宣布停用GPT-4o，结果用户发现“智能路由”乱跳模型，推理能力忽高忽低，Plus会员每周使用限额从2900次砍到200次，堪称“史诗级背刺”。
连夜紧急回调：面对骂声，OpenAI创始人Sam Altman亲自下场道歉，宣布恢复GPT-4o可选、翻倍Plus会员限额、优化路由逻辑，还承诺让“当前使用的模型”更透明。

推理能力扛打：在FrontierMath等基准测试中，GPT-5（高推理模式）创下新纪录，尤其是复杂逻辑任务表现亮眼；创意写作和幻觉控制能力也有提升，短篇故事生成超越同类模型。
速度与成本的博弈：新增“优先级处理”功能，付费越高响应越快（最低750ms延迟），但代价是token消耗暴增——相同视觉提示下，比GPT-4.1多花4-5倍token，性价比遭质疑。
coding能力喜忧参半：在SWE-bench测试中，GPT-5准确率约65%，略逊于Anthropic的Opus 5（68%），但胜在成本低；不过用户反馈“精确提示时封神，模糊指令时拉垮”。

AI圈从不缺“搅局者”，GPT-5忙着“灭火”时，其他选手悄悄放大招——

阿里的Qwen3系列（30B和235B版本）宣布支持100万token上下文，靠“双块注意力”和稀疏推理技术，在近百万token长度时速度提升3倍，还兼容vLLM等部署工具。不过用户实测发现，长文本回忆能力不如Gemini，3万token就开始“失忆”，看来还得优化。

CEO Demis Hassabis宣布“密集发布期”，一口气推出Genie-3（世界模拟）、Gemini 2.5 Pro Deep Think（深度推理）、AlphaEarth（地球科学分析）等，其中NotebookLM的“视频概览”功能因直观易懂圈粉无数。

Claude 4 Sonnet新增“后台任务”功能，支持实时监控bash命令，还能自定义终端状态线，程序员表示“终于不用盯着屏幕等结果了”。

GPT-5的“闭源霸权”让开源圈炸了锅，有人怒喷“开源作秀”，有人闷头搞技术——

推出的开源模型GPT-OSS被质疑“故意做弱”，用来应付舆论。但实测发现，120B版本本地部署表现不差，尤其在安全过滤任务中，500次测试仅拒绝1次，适合企业场景。

llama.cpp逆天优化：新增“注意力 sink”技术，处理8192token提示时速度提升3倍，120B模型在8GB显存的GPU上就能跑，还支持CPU分流计算，平民玩家狂喜。
Unsloth免费微调：推出GPT-OSS微调工具，20B模型用14GB显存就能训，120B模型65GB显存搞定，开源党直呼“良心”。

本周的争论，本质是AI发展到新阶段的矛盾——

最后来个灵魂拷问：你觉得GPT-5值得升级吗？还是更期待开源模型的逆袭？评论区聊聊～关注我，每周带你看透AI圈的“神仙打架”！

【声明】内容源于网络

洞见畏来

专注于前沿科技趋势，剖析底层算法逻辑，深耕商业化场景落地

内容 633

粉丝 0

洞见畏来专注于前沿科技趋势，剖析底层算法逻辑，深耕商业化场景落地

总阅读228

粉丝0

内容633