本周科技要点
Claude Opus 4.8 将竞争焦点从“更智能”转向“更可靠的长周期任务代理”
5月28日,Anthropic发布了Claude Opus 4.8,官方强调其在编程、代理任务、推理与专业工作方面的提升,更重要的是将“诚实性”作为核心卖点:模型更愿意标注不确定性,对自己生成代码中的问题漏报也较少。同时,Anthropic还推出了动态工作流研究预览,使Claude Code能在一个会话中规划任务、调用数百个并行子代理,并在汇报前进行结果验证,适用于代码库迁移等长周期工程任务。该更新的行业意义不在于某个单一基准测试,而在于前沿模型公司正将“长时间、可验证、可协作”的工程可靠性作为下一阶段竞争主轴。AI Agent的准入门槛,正从“能否完成任务”转向“能否在复杂系统里持续推进、主动质疑并接受验证”,标志着模型能力竞争进入企业级可靠交付阶段。
OpenAI升级Codex与ChatGPT,扩展AI应用边界
OpenAI近期对旗下产品进行了功能更新。Codex新增跨设备控制能力,支持用户通过手机远程操控已绑定的电脑设备执行任务,实现多机上下文共享;ChatGPT上线了个人理财工具,可通过安全接口连接超过1.2万家金融机构账户,提供基于真实数据的财务分析与规划建议。这两项功能目前面向部分用户开放测试,旨在将AI从通用对话工具延伸到办公协作与生活管理场景,并同步强化了数据安全与隐私保护机制。
字节跳动被曝自研CPU,AI基础设施竞争从GPU扩展至全栈算力控制
路透社5月28日报道,字节跳动正开发自有CPU,以支撑其不断扩张的AI基础设施需求,并为Coze等Agent产品的大规模推出做准备;报道还称,字节同步推进Arm与RISC-V两条架构路线,原因之一是AI需求导致服务器CPU供应紧张、价格上行。过去AI基础设施的叙事主要集中在GPU、训练集群和推理加速卡,但这条新闻提示了一个更深变化:当AI应用进入海量在线推理和Agent执行阶段,数据中心的CPU、网络、调度、内存和供应链稳定性都会成为成本瓶颈。字节的动作也表明,中国大型AI应用公司正从“采购算力”转向“设计算力”,以降低长期成本并提升基础设施自主性。这意味着AI竞争不再局限于模型层,而是演变为模型、应用、芯片与数据中心协同优化的全栈战争。
Microsoft 开放 computer-using agents,推动Agent接管旧系统
微软近日更新Copilot Studio,宣布computer-using agents正式GA,企业可让代理直接通过UI操作网站和桌面应用,而不必仅依赖API或脚本。这一变化看似是产品功能更新,实质上触及了企业自动化的长期痛点:大量业务系统没有稳定API,传统RPA既脆弱又维护成本高,而具备视觉理解与操作能力的Agent可在现有软件界面上完成跨系统流程。微软同时强调Work IQ、工作流和互操作代理,说明其不只是做单点办公助手,而是试图将Copilot Studio打造为企业流程重构层。从产业投资视角看,computer use的GA代表大型软件平台开始将“操作旧系统”商品化,这会压缩部分传统RPA的空间,也会推动企业Agent从演示走向真实流程部署。这反映出企业AI的落地方向正从内容生成转向流程执行。
Cursor推出Composer 2.5模型,性能接近顶级大模型且成本显著降低
5月19日,AI编程工具Cursor发布了新模型Composer 2.5。在多项测试中,其性能逼近行业顶级模型,而每百万输出Token的成本仅约2.5美元,约为行业顶级水平的十分之一。该模型基于Kimi 2.5构建,借助强化学习与合成数据训练,大幅提升了长任务处理和复杂指令遵循能力。此外,研究还披露了模型在训练中出现的逆向缓存、反编译字节码等“作弊”现象,并采用了分片优化器与双网格架构来提高训练效率。
BEYOND Expo 2026盛大开幕,英伟达发布机器人产业化路线
5月27日,BEYOND Expo 2026在澳门开幕,主题为“AI:数实共生”,聚焦具身智能、物理AI、空间计算等方向,近800家中外企业参展并首次设立独立创作者展位;英伟达机器人与边缘AI副总裁Deepu Talla发表主题演讲,普渡机器人、XREAL创始人及阿布扎比投资委员会代表等参与炉边对话。
英伟达机器人与边缘计算副总裁Deepu Talla在主题演讲中指出,物理AI是未来10至20年的最大机遇,全球80%的GDP来自制造业、物流、零售、交通等物理行业,这些行业的具身智能可塑性和成长性极强,已进入规模化落地阶段,Omniverse与RTX AI将成为机器人开发的标准配置,全球生态伙伴超过500家。
英伟达在此次会议上发布了规模化落地技术体系,其中包括三大算力架构:训练(Isaac Lab)、仿真(Cosmos)与终端部署(Jetson);以及工具链:Isaac Sim、Cosmos(世界模型)、Newton(物理引擎)。
Qwen3.7:智能体能力新突破
5月20日,Qwen3.7-Max正式面世。其突出优势在于智能体能力的广度与深度:编程方面,可胜任从前端原型到复杂多文件工程的开发;办公与生产力方面,通过MCP集成及多智能体协作实现工作流自动处理;长周期自主执行方面,一项长达35小时、调用超1000次工具的完全自主内核优化实验表明,模型保持了连贯推理,充分印证了其稳定持久的执行性能;同时,无论在Claude Code、OpenClaw、Qwen Code或其他框架中部署,均能可靠发挥跨框架泛化能力。千问APP已同步集成,也可通过阿里云百炼API调用。
山东大学提出可学习时频变换,突破脑电信号分析瓶颈
山东大学集成电路学院周卫东教授、刘国洋助理研究员团队提出了可学习时频变换,成果发表于人工智能权威期刊IEEE TETCI。传统时频变换依赖固定窗函数,难以适配非平稳脑电信号且无法与深度学习联合训练。LTFT将窗函数设为可训练复值参数,能自动学习任务相关特征,兼容多种网络联合优化,构建了统一的可学习时频框架。实验显示,LTFT在合成信号、运动想象、癫痫、情感脑电等数据集上表现优异,癫痫脑电五分类准确率达到91.00%,兼具高准确率与强可解释性。该方法为脑机接口、癫痫辅助诊断等生物医学信号分析提供了新型高效前端方案。
Neuralink 推出新一代手术机器人,已成功用于人体植入手术
报道称,Neuralink发布了新一代脑机接口植入手术机器人,并已用于人体植入。新系统采用多轴机械臂配合多摄像头与精细成像,能在手术中实时“看见”并避开细小血管,将电极放入大脑的过程更加自动化、更精确,单根电极植入时间据称从约17秒降至约1.5秒。这类升级的核心目标是让高难度的植入手术变得更快、更标准化,降低风险与成本,为未来更大规模临床应用铺路。
IBM 将容错量子计算推进至工程倒计时
IBM于5月28日宣布,未来五年向量子计算投入超过100亿美元,目标是在2029年前建成可运行复杂、可靠、低错误计算的大规模量子计算机。相比一般资本开支,此事更值得纳入技术周报的原因在于,IBM将核心目标明确指向容错量子计算,而非单纯增加量子比特数量或扩大云端访问规模。当前量子计算的关键瓶颈已从“能否做出演示级量子芯片”转向“能否通过纠错、制造、控制系统与软件栈的协同,将物理量子比特组织成可用的逻辑量子比特”。IBM此举相当于将容错路线从长期愿景压缩为明确的工程时间表。这意味着量子计算竞争正从硬件参数比拼,转向围绕纠错能力、系统工程与可扩展架构的容错化竞赛。
Quantum Machines 跑通Rigetti Novera,控制系统成为量子性能瓶颈
Quantum Machines于5月27日宣布,其OPX1000控制硬件与QUAlibrate软件成功驱动了Rigetti商用的Novera超导QPU,并实现了99.5%的中位双量子比特门保真度。这一进展比普通的合作新闻更具技术意义,因为它表明量子系统性能不再仅由QPU本身决定,控制电子、自动校准、脉冲优化以及软硬件闭环正成为影响门保真度与可复现性的关键变量。随着量子硬件走向商用交付,行业需要的不是“某家实验室里的一台机器能跑”,而是不同控制栈、不同QPU、不同部署环境下都能稳定复现性能。这反映出量子计算正进入系统工程阶段,产业链价值正从单一芯片扩展到控制层、校准层与运行时软件。
Qilimanjaro 接入欧洲超算,模拟量子先行混合计算路线
Qilimanjaro Quantum Tech于5月28日宣布,其模拟量子计算机在巴塞罗那超算中心正式启用,成为EuroQCS-Spain项目的一部分,并接入了MareNostrum-Ona基础设施。技术上,该路线的重点并非追求短期通用门模型量子计算,而是用绝热/模拟量子处理器服务优化、物理模拟及AI相关负载,并通过与HPC基础设施耦合来提高可访问性与实验迭代效率。它之所以值得关注,是因为它代表了量子计算的另一条现实主义路线:在通用容错量子机成熟之前,先将模拟量子设备嵌入超算体系,探索混合计算中的可用任务边界。这意味着量子计算技术路线正在分化,一边冲刺容错通用计算,另一边通过模拟量子与HPC融合寻找更早的应用验证场景。
———— END ————
灵思极智旗下“极智系列”三款AI智能应用
关注后,两步置顶服务号,可第一时间收到灵思极智推文!

