

一周AI大事件

阿里云云栖号

2025-12-15

导读：• Qwen本周多项更新发布，强化全模态AI与智能体落地能力；• 阿里云通义智能硬件站，剧透第一波；• 谷歌重返智能眼镜市场，推多款Android XR设备。

人工智能技术的飞速进步，正在重塑全球商业格局，其影响辐射到各个行业领域。鉴于此，阿里云云栖号特别推出《一周AI大事件》，汇聚全球人工智能的最新动态。

模型风向标

Qwen本周多项更新发布，强化全模态AI与智能体落地能力

12月9日-11日，通义千问连发多项大模型更新：

Qwen Code v0.3.0正式发布，功能、语言国际化与安全稳定性、生态适配四个方向系统升级，开发体验更高效可靠。
Qwen3-Omni-Flash-2025-12-01上线，全面提升文本、语音、图像和视频的多模态理解与生成能力。
Qwen3-TTS全面升级，新增49种音色及多种方言支持，语音生成更拟人。

同期，AgentScope 1.0正式开源，推出Alias通用智能体、EvoTraders交易仿真平台等开箱即用应用，并集成语音交互、动态技能扩展与生产级运行时，支持Java等企业技术栈，推动智能体从原型走向产业落地。

Mistral AI发布开源代码模型Devstral 2，限制高收入企业免费使用

12月10日，Mistral AI发布新一代开源代码模型Devstral 2系列，包含123B和24B两种参数版本，在在SWE-bench Verified上表现优异。新模型支持多文件代码理解与错误修复，可通过API免费试用，并可在消费级硬件上部署。同时推出的还有原生命令行工具Mistral Vibe CLI，支持在终端中通过自然语言操作代码库。值得注意的是，该模型采用的修改版MIT许可证规定，全球月收入超过2000万美元的企业不得免费使用，需另行授权。

微软开源轻量级实时TTS模型VibeVoice-Realtime-0.5B

微软近日开源了参数规模为0.5B的实时文本转语音（TTS）模型VibeVoice-Realtime-0.5B。该模型支持实时流式合成，首包延迟约300毫秒，可边输入文本边生成语音，适用于长文本和多角色对话场景，最多支持4个角色自然交替发声。模型具备情绪感知、中英文双语生成能力，并能在长时间对话中保持语音风格一致。其应用涵盖智能助手、会议记录、播客生成、游戏NPC及本地化客服系统，已在GitHub平台发布并获得广泛关注。

应用抢先看

公测23天，千问APP月活突破3000万

自11月17日公测仅23天，千问月活跃用户数（含APP、Web、PC端）已突破3000万，成为全球增长最快的AI应用。同时，千问APP正在加速从“会聊天”迈向“能办事”，向所有用户首批开放AI PPT、AI写作、AI文库、AI讲题四项新功能。

普渡发布四足机器人PUDU D5，加速具身智能多场景商业化落地

12月3日，普渡机器人推出新一代行业级四足机器人PUDU D5系列，具备轮足与点足两种形态，专为复杂非结构化环境设计。该机型支持IP67防护和全天候作业，搭载双芯片架构，总算力达275TOPS，可实现高精度感知、自主导航与AI决策，负载30公斤，续航14公里。作为其多形态产品矩阵的关键一环，PUDU D5将与专用、类人形及人形机器人协同，拓展工业巡检、交通枢纽、园区安防等全场景应用，推动具身智能在全球范围的规模化商用。

谷歌重返智能眼镜市场，推多款Android XR设备

12月9日，谷歌宣布推出基于Android XR系统的多款智能眼镜，正式回归该市场。产品包括与XREAL合作的有线双目XR眼镜Project Aura，具备70°视场角和手势交互；以及两款无线AI眼镜，分别支持语音交互、拍照和单目AR信息显示。新品深度集成Gemini AI，可处理通知、翻译、导航等任务，并强调日常佩戴与手机协同。设备将于2026年上市，部分未来型号还将支持iOS系统。

Project Aura支持和头显一样的手势交互，并带有透视效果 | 图源谷歌

Adobe将Photoshop等工具集成至ChatGPT，支持文字指令修图

12月10日，Adobe宣布旗下Photoshop、Express和Acrobat正式接入ChatGPT。用户可通过自然语言指令在聊天界面直接编辑图片、设计文档或处理PDF，降低创意工具使用门槛。该功能免费向所有ChatGPT用户开放，支持调整图像亮度、对比度、饱和度及背景模糊等基础功能，但暂不包含生成式填充等高级选项。

科技第一线

阿里云通义智能硬件展，剧透第一波！

将于2026年1月8日-11日，在深圳·海上世界文化艺术中心举办的「阿里云通义智能硬件展」本周放出第一波剧透：

四大亮点板块，潮玩穿戴、办公刚需、生活助手等等1000+智能硬件产品，最全品类覆盖，每款产品都带有通义大模型的强大基因；还有与顶尖消费电子战CES同期发布的AI新品，第一时间上手全球最新“黑科技”；此外AI打卡点更是遍布全场，参与就有机会赢取超豪华AI大奖。

👆扫码申领门票👆

英伟达发布CUDA 13.1，迎来二十年来最大更新

近日，英伟达正式发布CUDA Toolkit 13.1，称其为20年来最大规模的更新。新版本核心引入CUDA Tile编程模型，通过更高层次的抽象简化对张量核心等专用硬件的调用，并首发支持Blackwell架构GPU。同时，运行时API开放对轻量级“Green Context”的支持，提升GPU资源调度灵活性；cuBLAS、cuSPARSE等数学库也新增多项功能与性能优化。此外，开发者工具如Nsight Compute和Compute Sanitizer同步升级，增强调试与分析能力。

全球首个太空训练AI模型成功运行，H100卫星上实现轨道智能计算

12月11日，美国初创公司Starcloud宣布其搭载英伟达H100 GPU的Starcloud-1卫星，在太空中成功训练并运行大语言模型。该卫星基于Karpathy的nanoGPT架构，使用莎士比亚语料完成训练，并能以文艺复兴风格对话；同时成功部署谷歌Gemma模型，向地球发送首条信息。此外，Starcloud-1还具备实时野火识别与传感器数据分析能力。此举标志着高性能AI首次实现太空原位训练与推理，为未来轨道数据中心奠定基础。

谷歌推出新型AI架构Titans，旨在突破Transformer局限

近日NeurIPS 2025大会上，谷歌DeepMind推出名为Titans的新AI架构及配套框架MIRAS。该技术融合了RNN的推理速度与Transformer的表达能力，支持超长上下文处理（达200万token），并具备动态更新长期记忆的能力。谷歌表示，Titans有望解决现有大模型在持续学习和多步推理方面的短板。DeepMind CEO Hassabis重申AGI可能在2030年前实现，但强调仍需1-2项类似Transformer级别的关键技术突破。