人工智能技术的飞速进步,正在重塑全球商业格局,其影响辐射到各个行业领域。鉴于此,阿里云云栖号特别推出《一周AI大事件》,汇聚全球人工智能的最新动态。
模型风向标
01
Qwen本周多项更新发布,强化全模态AI与智能体落地能力
12月9日-11日,通义千问连发多项大模型更新:
Qwen Code v0.3.0正式发布,功能、语言国际化与安全稳定性、生态适配四个方向系统升级,开发体验更高效可靠。
Qwen3-Omni-Flash-2025-12-01上线,全面提升文本、语音、图像和视频的多模态理解与生成能力。
Qwen3-TTS全面升级,新增49种音色及多种方言支持,语音生成更拟人。
同期,AgentScope 1.0正式开源,推出Alias通用智能体、EvoTraders交易仿真平台等开箱即用应用,并集成语音交互、动态技能扩展与生产级运行时,支持Java等企业技术栈,推动智能体从原型走向产业落地。
Mistral AI发布开源代码模型Devstral 2,限制高收入企业免费使用
12月10日,Mistral AI发布新一代开源代码模型Devstral 2系列,包含123B和24B两种参数版本,在在SWE-bench Verified上表现优异。新模型支持多文件代码理解与错误修复,可通过API免费试用,并可在消费级硬件上部署。同时推出的还有原生命令行工具Mistral Vibe CLI,支持在终端中通过自然语言操作代码库。值得注意的是,该模型采用的修改版MIT许可证规定,全球月收入超过2000万美元的企业不得免费使用,需另行授权。
微软开源轻量级实时TTS模型VibeVoice-Realtime-0.5B
微软近日开源了参数规模为0.5B的实时文本转语音(TTS)模型VibeVoice-Realtime-0.5B。该模型支持实时流式合成,首包延迟约300毫秒,可边输入文本边生成语音,适用于长文本和多角色对话场景,最多支持4个角色自然交替发声。模型具备情绪感知、中英文双语生成能力,并能在长时间对话中保持语音风格一致。其应用涵盖智能助手、会议记录、播客生成、游戏NPC及本地化客服系统,已在GitHub平台发布并获得广泛关注。
应用抢先看
02
公测23天,千问APP月活突破3000万
自11月17日公测仅23天,千问月活跃用户数(含APP、Web、PC端)已突破3000万,成为全球增长最快的AI应用。同时,千问APP正在加速从“会聊天”迈向“能办事”,向所有用户首批开放AI PPT、AI写作、AI文库、AI讲题四项新功能。
普渡发布四足机器人PUDU D5,加速具身智能多场景商业化落地
12月3日,普渡机器人推出新一代行业级四足机器人PUDU D5系列,具备轮足与点足两种形态,专为复杂非结构化环境设计。该机型支持IP67防护和全天候作业,搭载双芯片架构,总算力达275TOPS,可实现高精度感知、自主导航与AI决策,负载30公斤,续航14公里。作为其多形态产品矩阵的关键一环,PUDU D5将与专用、类人形及人形机器人协同,拓展工业巡检、交通枢纽、园区安防等全场景应用,推动具身智能在全球范围的规模化商用。
谷歌重返智能眼镜市场,推多款Android XR设备
12月9日,谷歌宣布推出基于Android XR系统的多款智能眼镜,正式回归该市场。产品包括与XREAL合作的有线双目XR眼镜Project Aura,具备70°视场角和手势交互;以及两款无线AI眼镜,分别支持语音交互、拍照和单目AR信息显示。新品深度集成Gemini AI,可处理通知、翻译、导航等任务,并强调日常佩戴与手机协同。设备将于2026年上市,部分未来型号还将支持iOS系统。
Project Aura支持和头显一样的手势交互,并带有透视效果 | 图源谷歌
Adobe将Photoshop等工具集成至ChatGPT,支持文字指令修图
12月10日,Adobe宣布旗下Photoshop、Express和Acrobat正式接入ChatGPT。用户可通过自然语言指令在聊天界面直接编辑图片、设计文档或处理PDF,降低创意工具使用门槛。该功能免费向所有ChatGPT用户开放,支持调整图像亮度、对比度、饱和度及背景模糊等基础功能,但暂不包含生成式填充等高级选项。
科技第一线
03
阿里云通义智能硬件展,剧透第一波!
将于2026年1月8日-11日,在深圳·海上世界文化艺术中心举办的「阿里云通义智能硬件展」本周放出第一波剧透:
四大亮点板块,潮玩穿戴、办公刚需、生活助手等等1000+智能硬件产品,最全品类覆盖,每款产品都带有通义大模型的强大基因;还有与顶尖消费电子战CES同期发布的AI新品,第一时间上手全球最新“黑科技”;此外AI打卡点更是遍布全场,参与就有机会赢取超豪华AI大奖。
👆扫码申领门票👆
英伟达发布CUDA 13.1,迎来二十年来最大更新
近日,英伟达正式发布CUDA Toolkit 13.1,称其为20年来最大规模的更新。新版本核心引入CUDA Tile编程模型,通过更高层次的抽象简化对张量核心等专用硬件的调用,并首发支持Blackwell架构GPU。同时,运行时API开放对轻量级“Green Context”的支持,提升GPU资源调度灵活性;cuBLAS、cuSPARSE等数学库也新增多项功能与性能优化。此外,开发者工具如Nsight Compute和Compute Sanitizer同步升级,增强调试与分析能力。
全球首个太空训练AI模型成功运行,H100卫星上实现轨道智能计算
12月11日,美国初创公司Starcloud宣布其搭载英伟达H100 GPU的Starcloud-1卫星,在太空中成功训练并运行大语言模型。该卫星基于Karpathy的nanoGPT架构,使用莎士比亚语料完成训练,并能以文艺复兴风格对话;同时成功部署谷歌Gemma模型,向地球发送首条信息。此外,Starcloud-1还具备实时野火识别与传感器数据分析能力。此举标志着高性能AI首次实现太空原位训练与推理,为未来轨道数据中心奠定基础。
谷歌推出新型AI架构Titans,旨在突破Transformer局限
近日NeurIPS 2025大会上,谷歌DeepMind推出名为Titans的新AI架构及配套框架MIRAS。该技术融合了RNN的推理速度与Transformer的表达能力,支持超长上下文处理(达200万token),并具备动态更新长期记忆的能力。谷歌表示,Titans有望解决现有大模型在持续学习和多步推理方面的短板。DeepMind CEO Hassabis重申AGI可能在2030年前实现,但强调仍需1-2项类似Transformer级别的关键技术突破。
这就是小七为大家整理的AI领域热门事件,每周发布,欢迎大家持续追更~
——以上内容综合自:量子位、新智元、机器之心、智东西、通义千问、阿里巴巴、阿里云等公众号
延伸阅读
/END/
点击阅读原文,立即报名参与「阿里云通义智能硬件展」!




