大数跨境
0
0

AiWeekly | 每周AI热点精选 12.01-12.07

AiWeekly | 每周AI热点精选 12.01-12.07 南京新一代人工智能研究院
2025-12-08
3
导读:每周一17:00见。


技术动态


01

深度求索:发布两个正式版模型DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale


12月1日,深度求索DeepSeek 同时发布两个正式版模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。


DeepSeek-V3.2 是将思考融入工具使用的模型,并且同时支持思考模式与非思考模式的工具调用;目标是平衡推理能力与输出长度,适合日常使用。DeepSeek-V3.2-Speciale 是DeepSeek-V3.2的长思考增强版,同时结合了 DeepSeek-Math-V2 的定理证明能力,目标是将开源模型的推理能力推向极致,探索模型能力的边界。


技术报告:

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2/resolve/master/assets/paper.pdf

开源地址

DeepSeek-V3.2

HuggingFace:

https://huggingface.co/deepseek-ai/DeepSeek-V3.2

ModelScope:

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2

DeepSeek-V3.2-Speciale

HuggingFace:

https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale

ModelScope:

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Speciale


原文链接>> DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理


02

阿里:发布文本渲染图像生成模型Ovis-Image


12月3日,阿里Ovis团队发布文本渲染图像生成模型Ovis-Image,专为高质量文本渲染优化,并且保持低计算成本。


Ovis-Image基于Ovis-U1构建,通过增加MMDiT的参数并优化结构设计,采用以文本为核心的训练流程,采用大规模预训练与精心设计的后训练优化。模型整体由三个关键部分精密咬合而成。大脑是 Ovis 2.5 多模态大模型,负责作画的手是参数量为 7.37B 的多模态扩散 Transformer (MMDiT),视觉信息的压缩与解压则交给了来自 FLUX.1-schnell 的变分自编码器 (VAE)。为了保持视觉特征的稳定性。


技术报告地址:

https://arxiv.org/pdf/2511.22982

GitHub地址:

https://github.com/AIDC-AI/Ovis-Image

Hugging Face地址:

https://huggingface.co/AIDC-AI/Ovis-Image-7B

ModelScope地址:

https://www.modelscope.cn/models/AIDC-AI/Ovis-Image-7B


原文链接>> 图像生成Ovis-Image再开源,7B小参数媲美GPT-4o和20B开源模型


03

Mistral AI:发布Mistral 3系列模型


12月3日,Mistral AI发布新一代开放模型Mistral 3系列模型。


该系列有多个模型,具体包括:Ministral 3-14B、8B、3B,每个模型都发布了基础版、指令微调版和推理版;一款开源MoE-Mistral Large 3,总参数量675B,激活参数41B。Mistral 表示所有模型均采用 Apache 2.0 许可证发布。


原文链接>> OpenAI狂卷,DeepSeek封神,却被Mistral偷了家?


04

NVIDIA:推出Reasoning VLA模型Alpamayo-R1(AR1)


12月2日,NVIDIA Research 推出 Alpamayo-R1(AR1),是一种全新的带有推理能力的视觉 - 语言 - 行动模型(Reasoning VLA),让车辆不只是「执行指令」,而是能在决策前「推理出因果关系」。


AR1采用扩散式轨迹解码器和多阶段训练策略,规划精度提升12%,越界率降低35%,近碰率降低25%,推理-行动一致性提升37%,端到端延迟仅99ms。模型引入多维度奖励机制包括专家推理反馈、推理-行动一致性奖励和底层安全奖励,能解释每个驾驶决策的原因。


详细内容:

https://research.nvidia.com/publication/2025-10_alpamayo-r1


原文链接>> 英伟达拿出推理版VLA:Alpamayo-R1让自动驾驶AI更会动脑子


05

华为:发布扩散语言模型openPangu-R-7B-Diffusion


近日,华为发布 openPangu-R-7B-Diffusion,基于openPangu-Embedded-7B 进行少量数据(800B tokens)续训练,成功将扩散语言模型的上下文长度扩展至 32K。


openPangu-R-7B-Diffusion 在注意力机制上创新性地融合了自回归的前文因果注意力掩码(Causal Attention Mask),从根本上解决了架构适配难题。在训练策略上,openPangu-R-7B-Diffusion 延续了 BlockDiffusion 的思路(拼接带掩码的 Block 与无掩码的 Context),但进行了关键优化。


Base模型链接:

https://ai.gitcode.com/ascend-tribe/openPangu-7B-Diffusion-Base

慢思考模型链接:

https://ai.gitcode.com/ascend-tribe/openPangu-R-7B-Diffusion


原文链接>> 华为新开源!扩散语言模型突破32K上下文,还解锁了「慢思考」


06

昆仑万维:发布Mureka V7.6和Mureka O2模型


近日,昆仑万维正式发布Mureka V7.6和Mureka O2模型,更好地为大规模音乐商业化服务。


模型在音乐性、编曲能力、音质质感和Prompt贴合度等多维度显著提升,响应速度和推理效率大幅增强,更适合大规模商业化使用。模型延续MusiCoT细粒度音乐建模体系,强化段落关系、乐器互动与情绪走向建模能力,空间声场与音质生成达到更接近专业制作标准。


体验地址Mureka:

https://www.mureka.cn

接入Mureka API:

https://platform.mureka.cn


原文链接>> Mureka V7.6和Mureka O2模型正式发布,开启AI音乐创作黄金时代


行业动态


01

阿里千问:上线学习大模型Qwen3-Learning


12月3日,阿里千问正式上线学习大模型Qwen3-Learning面向学习场景发布拍题答疑、作业批改两项重要更新,全部免费、不限次数。


据千问官方介绍,基于Qwen3训练的学习大模型Qwen3-Learning,其独家资料库覆盖全学段、全学科,拥有海量真题和解析,该模型不仅懂教材、懂考试,更懂学生,答案准确率更高,解题与批改能力实现了大幅提升。


原文链接>> 千问上线阿里最强学习模型,AI辅导迎来“特级教师”!


02

火山引擎:正式发布豆包图像创作模型Doubao-Seedream-4.5


12月3日,火山引擎正式发布豆包图像创作模型Doubao-Seedream-4.5,面向用户开启公测。


Doubao-Seedream-4.5在主体一致性、指令遵循精准度、空间逻辑理解及美学表现力等方面实现迭代,进一步提升了图像生成的整体质量与稳定性。此次升级重点强化了多图组合生成能力,确保多源素材融合时的自然感与一致性;同时优化了海报排版与 Logo 设计功能,支持高精度图文混排,广告物料生成更简单高效。


原文链接>> 豆包图像创作模型Seedream 4.5发布:聚焦商业生产力场景


03

亚马逊:发布一系列重磅AI新品


12月2日,在年度云计算产业盛会AWS re:Invent上,亚马逊云科技(AWS)发布一系列重磅AI新品。


包括最新AI芯片Trainium4、基于其首款3nm AI芯片的Amazon EC2 Trainium3 UltraServers、第二代自研大模型Amazon Nova 2系列,以及大量Agent开发利器。从AI基础设施、AI推理平台、企业数据管理到智能体开发工具、前沿智能体,通通迎来一大波升级。


原文链接>> 亚马逊杀疯了!连甩十大重磅发布,揭Agent大招、自研芯进展


04

字节跳动:发布豆包手机助手技术预览版


12月1日,字节跳动发布豆包手机助手技术预览版。


豆包手机助手是豆包和手机厂商在操作系统层面合作的手机AI助手。基于豆包大模型的能力和手机厂商的授权,豆包手机助手能够为用户带来更方便的交互和更丰富的体验。


原文链接>> 豆包手机助手发布技术预览版


05

可灵AI:全能灵感周,连续5天上新AI产品


12月1日,可灵AI开启全能灵感周,连续5天上新AI产品,相继发布统一多模态视频模型可灵视频O1、图像模型可灵图片O1、音画同出模型可灵2.6、可灵数字人2.0、可灵 O1 主体库&对比模板等。


原文链接>> 可灵AI,开启全能灵感周


政策趋势


01

中国民用航空局:印发《关于推动“人工智能+民航”高质量发展的实施意见》


12月4日,中国民用航空局印发《关于推动“人工智能+民航”高质量发展的实施意见》,旨在加快推动人工智能在民航领域广泛深度融合创新,促进行业高质量发展。


《实施意见》围绕安全、运行、出行、物流、监管、规划建设等六大重点领域,结合民航发展需求与人工智能技术优势,系统梳理了“人工智能+民航”创新赋能场景。《实施意见》明确,要强化“人工智能+民航”高质量发展的要素供给,围绕高质量数据集建设、基础设施平台构筑和行业模型算法研究等方面,提升民航领域人工智能基础支撑能力。


原文链接>> 一图读懂︱《关于推动“人工智能+民航”高质量发展的实施意见》


02

教育部教师队伍建设专家指导委员会:正式发布《教师生成式人工智能应用指引(第一版)》


近日,教育部教师队伍建设专家指导委员会正式发布《教师生成式人工智能应用指引(第一版)》,着力引导教师科学、安全、合规、理性地应用生成式人工智能,深入推动人工智能赋能教育教学大规模运用,促进教育改革创新。


《指引》主体包括场景指引和规范指引两大部分。场景指引建立“正面清单”,提供学习、教学、育人、评价、管理、研究等“六大助力”应用方向指引。规范指引建立“约束清单”,强化伦理意识和责任,用18个行为示例,明确行为底线红线,推动技术向善、育人为本。


原文链接>> 教师如何合规使用AI?第一版《指引》来了


声明:资料素材均来源官方媒体/网络,如有侵权,请联系删除。


END


南京新一代人工智能研究院

Nanjing Research 

Institute of Next-generation Artificial Intelligence

南京新一代人工智能研究院,是中国信息通信研究院在人工智能、大数据领域投资组建的控股企业,是江苏省人工智能产业公共技术服务平台的落地运营单位。

研究院以“服务国家战略实施,促进地方产业升级”为导向,在人工智能和大数据领域,开展前沿技术研究、标准制定、评测工具开发、实验能力建设等工作,可为企业提供全方位的诊断、咨询、培训、评估服务。

联系方式

吴老师 17788386765(微信同号)

杨老师 15221125491(微信同号)


【声明】内容源于网络
0
0
南京新一代人工智能研究院
南京新一代人工智能研究院专注人工智能基础研究,建设人工智能标准体系;构建试验评测环境,开展评估评测;搭建公共技术服务平台,为产业界提供技术研究、标准制定、评估测试、产业咨询、人才培育等服务。
内容 624
粉丝 0
南京新一代人工智能研究院 南京新一代人工智能研究院专注人工智能基础研究,建设人工智能标准体系;构建试验评测环境,开展评估评测;搭建公共技术服务平台,为产业界提供技术研究、标准制定、评估测试、产业咨询、人才培育等服务。
总阅读737
粉丝0
内容624