

AiWeekly | 每周AI热点精选 12.01-12.07

南京新一代人工智能研究院

2025-12-08

导读：每周一17:00见。

技术动态

深度求索：发布两个正式版模型DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale

12月1日，深度求索DeepSeek 同时发布两个正式版模型：DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。

DeepSeek-V3.2 是将思考融入工具使用的模型，并且同时支持思考模式与非思考模式的工具调用；目标是平衡推理能力与输出长度，适合日常使用。DeepSeek-V3.2-Speciale 是DeepSeek-V3.2的长思考增强版，同时结合了 DeepSeek-Math-V2 的定理证明能力，目标是将开源模型的推理能力推向极致，探索模型能力的边界。

技术报告：

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2/resolve/master/assets/paper.pdf

开源地址

DeepSeek-V3.2

HuggingFace：

https://huggingface.co/deepseek-ai/DeepSeek-V3.2

ModelScope：

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2

DeepSeek-V3.2-Speciale

HuggingFace：

https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale

ModelScope：

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Speciale

原文链接>> DeepSeek V3.2 正式版：强化 Agent 能力，融入思考推理

阿里：发布文本渲染图像生成模型Ovis-Image

12月3日，阿里Ovis团队发布文本渲染图像生成模型Ovis-Image，专为高质量文本渲染优化，并且保持低计算成本。

Ovis-Image基于Ovis-U1构建，通过增加MMDiT的参数并优化结构设计，采用以文本为核心的训练流程，采用大规模预训练与精心设计的后训练优化。模型整体由三个关键部分精密咬合而成。大脑是 Ovis 2.5 多模态大模型，负责作画的手是参数量为 7.37B 的多模态扩散 Transformer (MMDiT)，视觉信息的压缩与解压则交给了来自 FLUX.1-schnell 的变分自编码器 (VAE)。为了保持视觉特征的稳定性。

技术报告地址：

https://arxiv.org/pdf/2511.22982

GitHub地址：

https://github.com/AIDC-AI/Ovis-Image

Hugging Face地址：

https://huggingface.co/AIDC-AI/Ovis-Image-7B

ModelScope地址：

https://www.modelscope.cn/models/AIDC-AI/Ovis-Image-7B

原文链接>> 图像生成Ovis-Image再开源，7B小参数媲美GPT-4o和20B开源模型

Mistral AI：发布Mistral 3系列模型

12月3日，Mistral AI发布新一代开放模型Mistral 3系列模型。

该系列有多个模型，具体包括：Ministral 3-14B、8B、3B，每个模型都发布了基础版、指令微调版和推理版；一款开源MoE-Mistral Large 3，总参数量675B，激活参数41B。Mistral 表示所有模型均采用 Apache 2.0 许可证发布。

原文链接>> OpenAI狂卷，DeepSeek封神，却被Mistral偷了家？

NVIDIA：推出Reasoning VLA模型Alpamayo-R1（AR1）

12月2日，NVIDIA Research 推出 Alpamayo-R1（AR1），是一种全新的带有推理能力的视觉 - 语言 - 行动模型（Reasoning VLA），让车辆不只是「执行指令」，而是能在决策前「推理出因果关系」。

AR1采用扩散式轨迹解码器和多阶段训练策略，规划精度提升12%，越界率降低35%，近碰率降低25%，推理-行动一致性提升37%，端到端延迟仅99ms。模型引入多维度奖励机制包括专家推理反馈、推理-行动一致性奖励和底层安全奖励，能解释每个驾驶决策的原因。

详细内容：

https://research.nvidia.com/publication/2025-10_alpamayo-r1

原文链接>> 英伟达拿出推理版VLA：Alpamayo-R1让自动驾驶AI更会动脑子

华为：发布扩散语言模型openPangu-R-7B-Diffusion

近日，华为发布 openPangu-R-7B-Diffusion，基于openPangu-Embedded-7B 进行少量数据（800B tokens）续训练，成功将扩散语言模型的上下文长度扩展至 32K。

openPangu-R-7B-Diffusion 在注意力机制上创新性地融合了自回归的前文因果注意力掩码（Causal Attention Mask），从根本上解决了架构适配难题。在训练策略上，openPangu-R-7B-Diffusion 延续了 BlockDiffusion 的思路（拼接带掩码的 Block 与无掩码的 Context），但进行了关键优化。

Base模型链接：

https://ai.gitcode.com/ascend-tribe/openPangu-7B-Diffusion-Base

慢思考模型链接：

https://ai.gitcode.com/ascend-tribe/openPangu-R-7B-Diffusion

原文链接>> 华为新开源！扩散语言模型突破32K上下文，还解锁了「慢思考」

昆仑万维：发布Mureka V7.6和Mureka O2模型

近日，昆仑万维正式发布Mureka V7.6和Mureka O2模型，更好地为大规模音乐商业化服务。

模型在音乐性、编曲能力、音质质感和Prompt贴合度等多维度显著提升，响应速度和推理效率大幅增强，更适合大规模商业化使用。模型延续MusiCoT细粒度音乐建模体系，强化段落关系、乐器互动与情绪走向建模能力，空间声场与音质生成达到更接近专业制作标准。

体验地址Mureka：

https://www.mureka.cn

接入Mureka API：

https://platform.mureka.cn

原文链接>> Mureka V7.6和Mureka O2模型正式发布，开启AI音乐创作黄金时代

行业动态

阿里千问：上线学习大模型Qwen3-Learning

12月3日，阿里千问正式上线学习大模型Qwen3-Learning面向学习场景发布拍题答疑、作业批改两项重要更新，全部免费、不限次数。

据千问官方介绍，基于Qwen3训练的学习大模型Qwen3-Learning，其独家资料库覆盖全学段、全学科，拥有海量真题和解析，该模型不仅懂教材、懂考试，更懂学生，答案准确率更高，解题与批改能力实现了大幅提升。

原文链接>> 千问上线阿里最强学习模型，AI辅导迎来“特级教师”！

火山引擎：正式发布豆包图像创作模型Doubao-Seedream-4.5

12月3日，火山引擎正式发布豆包图像创作模型Doubao-Seedream-4.5，面向用户开启公测。

Doubao-Seedream-4.5在主体一致性、指令遵循精准度、空间逻辑理解及美学表现力等方面实现迭代，进一步提升了图像生成的整体质量与稳定性。此次升级重点强化了多图组合生成能力，确保多源素材融合时的自然感与一致性；同时优化了海报排版与 Logo 设计功能，支持高精度图文混排，广告物料生成更简单高效。

原文链接>> 豆包图像创作模型Seedream 4.5发布：聚焦商业生产力场景

亚马逊：发布一系列重磅AI新品

12月2日，在年度云计算产业盛会AWS re:Invent上，亚马逊云科技（AWS）发布一系列重磅AI新品。

包括最新AI芯片Trainium4、基于其首款3nm AI芯片的Amazon EC2 Trainium3 UltraServers、第二代自研大模型Amazon Nova 2系列，以及大量Agent开发利器。从AI基础设施、AI推理平台、企业数据管理到智能体开发工具、前沿智能体，通通迎来一大波升级。

原文链接>> 亚马逊杀疯了！连甩十大重磅发布，揭Agent大招、自研芯进展

字节跳动：发布豆包手机助手技术预览版

12月1日，字节跳动发布豆包手机助手技术预览版。

豆包手机助手是豆包和手机厂商在操作系统层面合作的手机AI助手。基于豆包大模型的能力和手机厂商的授权，豆包手机助手能够为用户带来更方便的交互和更丰富的体验。

原文链接>> 豆包手机助手发布技术预览版

可灵AI：全能灵感周，连续5天上新AI产品

12月1日，可灵AI开启全能灵感周，连续5天上新AI产品，相继发布统一多模态视频模型可灵视频O1、图像模型可灵图片O1、音画同出模型可灵2.6、可灵数字人2.0、可灵 O1 主体库&对比模板等。

原文链接>> 可灵AI，开启全能灵感周

政策趋势

中国民用航空局：印发《关于推动“人工智能+民航”高质量发展的实施意见》

12月4日，中国民用航空局印发《关于推动“人工智能+民航”高质量发展的实施意见》，旨在加快推动人工智能在民航领域广泛深度融合创新，促进行业高质量发展。

《实施意见》围绕安全、运行、出行、物流、监管、规划建设等六大重点领域，结合民航发展需求与人工智能技术优势，系统梳理了“人工智能+民航”创新赋能场景。《实施意见》明确，要强化“人工智能+民航”高质量发展的要素供给，围绕高质量数据集建设、基础设施平台构筑和行业模型算法研究等方面，提升民航领域人工智能基础支撑能力。

原文链接>> 一图读懂︱《关于推动“人工智能+民航”高质量发展的实施意见》

教育部教师队伍建设专家指导委员会：正式发布《教师生成式人工智能应用指引（第一版）》

近日，教育部教师队伍建设专家指导委员会正式发布《教师生成式人工智能应用指引（第一版）》，着力引导教师科学、安全、合规、理性地应用生成式人工智能，深入推动人工智能赋能教育教学大规模运用，促进教育改革创新。

《指引》主体包括场景指引和规范指引两大部分。场景指引建立“正面清单”，提供学习、教学、育人、评价、管理、研究等“六大助力”应用方向指引。规范指引建立“约束清单”，强化伦理意识和责任，用18个行为示例，明确行为底线红线，推动技术向善、育人为本。

原文链接>> 教师如何合规使用AI？第一版《指引》来了

声明：资料素材均来源官方媒体/网络，如有侵权，请联系删除。

✦

END

南京新一代人工智能研究院

Nanjing Research

Institute of Next-generation Artificial Intelligence

南京新一代人工智能研究院，是中国信息通信研究院在人工智能、大数据领域投资组建的控股企业，是江苏省人工智能产业公共技术服务平台的落地运营单位。

研究院以“服务国家战略实施，促进地方产业升级”为导向，在人工智能和大数据领域，开展前沿技术研究、标准制定、评测工具开发、实验能力建设等工作，可为企业提供全方位的诊断、咨询、培训、评估服务。

联系方式

吴老师 17788386765（微信同号）

杨老师 15221125491（微信同号）

【声明】内容源于网络

南京新一代人工智能研究院

南京新一代人工智能研究院专注人工智能基础研究，建设人工智能标准体系；构建试验评测环境，开展评估评测；搭建公共技术服务平台，为产业界提供技术研究、标准制定、评估测试、产业咨询、人才培育等服务。

内容 624

粉丝 0

南京新一代人工智能研究院南京新一代人工智能研究院专注人工智能基础研究，建设人工智能标准体系；构建试验评测环境，开展评估评测；搭建公共技术服务平台，为产业界提供技术研究、标准制定、评估测试、产业咨询、人才培育等服务。

总阅读737

粉丝0

内容624