技术动态
01
OpenAI:发布circuit-sparsity模型和工具包
12月14日,OpenAI发布circuit-sparsity模型和工具包。
circuit-sparsity模型是一种新型AI模型训练方法,通过强制模型权重极度稀疏化(99.9%为零),使神经网络的计算过程像电路图一样可拆解和理解。该方法基于GPT-2架构,通过人为约束L0范数让模型形成解耦的"电路"模块。circuit-sparsity工具包提供了"激活桥"技术,能在稀疏模型和标准密集模型之间建立连接。
开源地址:
https://github.com/openai/circuit_sparsity
模型下载:
https://huggingface.co/openai/circuit-sparsity
02
智谱:开源四项视频生成核心技术
过去一周,智谱GLM先后开源了多模态模型家族:从「眼睛看得见」的视觉理解模型GLM‑4.6V,到「手能动起来」的AutoGLM,再到「语音听得懂」的GLM‑ASR,与「话能说出口」的GLM‑TTS。
12月12日,智谱再开源四项面向视频生成的核心技术成果:SCAIL、RealVideo、Kaleido与SSVAE。它们对准当前视频生成领域的三大难点:精细化可控生成、复杂时空结构建模,以及大规模训练成本控制。
原文链接>> 智谱多模态开源周收官:四项视频生成核心技术开源
03
Mistral AI:发布代码模型系列Devstral 2和原生CLI-Mistral Vibe
12月10日,Mistral AI发布代码模型系列Devstral 2,包含两个尺寸:Devstral 2 (123B) 和 Devstral Small 2 (24B)。此外,Mistral AI 还发布了原生CLI:Mistral Vibe。
Devstral 2 是一个Transformer模型,支持探索代码库并在多个文件中编排变更,同时保持架构级的上下文理解。它能追踪框架依赖关系、检测故障并尝试修正重试——从而解决错误修复和遗留系统现代化等挑战。
Mistral Vibe CLI 是一款由 Devstral 驱动的开源命令行编码助手。它能让用户在终端中使用自然语言,或通过智能体通信协议(Agent Communication Protocol)集成到用户的 IDE 中,来探索、修改和执行整个代码库的变更。它依据 Apache 2.0 许可证发布。
Devstral 2模型地址:
https://huggingface.co/collections/mistralai/devstral-2
Mistral Vibe CLI 开源地址:
https://github.com/mistralai/mistral-vibe
04
阿里通义实验室:推出图片生成工具Qwen-Image-i2L
12月10日,阿里通义实验室推出图片生成工具Qwen-Image-i2L,仅需单张样本即可训练LoRA实现个性化风格迁移。
Qwen-Image-i2L提供四款模型变体,包括风格模式(2.4B)、粗粒度模式(7.9B)、精细模式(7.6B)和偏见模式(30M),分别针对不同应用场景优化。模型基于Apache2.0许可开源,但从单张2D图提炼3D逻辑仍存在局限。
模型地址:
https://modelscope.cn/models/DiffSynth-Studio/Qwen-Image-i2L
HuggingFace:
https://huggingface.co/DiffSynth-Studio/Qwen-Image-i2L
05
商汤科技:推出实时语音驱动数字人技术SekoTalk
12月9日,商汤科技推出实时语音驱动数字人技术SekoTalk,提升了数字人视频的生成效率,还能支持多人、多语言的口型精准匹配,和超长时的稳定生成。
SekoTalk通过模型蒸馏,模型结构优化,以及模型与系统的协同设计,在保证生成质量的前提下,实现推理效率的跨越式提升。研究团队提出Phased DMD技术,把去噪过程建模为多阶段的MoE模型。在生成长视频时,SekoTalk提出混合参考图注入等方案,有效平衡动作多样性与画面稳定性。
免费在线体验平台:https://sekotalk.com
相关产品链接:https://seko.sensetime.com
Github:https://github.com/OpenSenseNova/SekoTalk
LightX2V试用:https://github.com/ModelTC/LightX2V
06
美团:发布图像生成模型LongCat-Image
12月8日,美团LongCat团队正式发布并开源 LongCat-Image 模型。
LongCat-Image 采用文生图与图像编辑同源的架构设计,并结合渐进式学习策略,在仅 6B 的紧凑参数规模下,实现了指令遵循精准度、生图质量与文字渲染能力的高效协同提升,尤其在单图编辑的可控性和文字生成的汉字覆盖度方面独具优势。
HuggingFace:
https://huggingface.co/meituan-longcat/LongCat-Image
GitHub:
https://github.com/meituan-longcat/LongCat-Image
07
NatureSelect(自然选择):发布情感大模型Echo-N1
近日,NatureSelect(自然选择)的研究团队Team Echo 发布情感大模型 Echo-N1。
Echo-N1模型仅32B参数,通过创新的情感模型训练方法(含生成式奖励模型、EPM情感物理模型、拟人化认知沙盒等核心技术),解决了传统模型在情感领域无法量化、易出现Reward Hacking、评测失真等问题,成功将RL用在了不可验证的主观情感领域。
论文链接:
https://arxiv.org/pdf/2512.00344v1
08
微软:开源轻量级实时 TTS模型VibeVoice-Realtime-0.5B
近日,微软开源了一款0.5B参数的轻量级实时 TTS模型VibeVoice-Realtime-0.5B。
该模型实现了多数巨型模型难以实现的实时发声能力:首包延迟仅约300毫秒,支持边输入文本边朗读,长文本处理无卡顿,还能实现多角色自然对话,真正让AI语音走向实时流式对话形态。
GitHub:
https://github.com/microsoft/VibeVoice
项目官网:
https://microsoft.github.io/VibeVoice
行业动态
01
灵初智能:发布具身原生人类数据采集方案Psi-SynEngine
12月11日,灵初智能发布具身原生人类数据采集方案 Psi-SynEngine。
该方案由灵初智能全栈自研,包含便携式外骨骼触觉手套数采套装、大规模 in the wild 数采数据管线、基于世界模型和强化学习的跨本体数据迁移模型,并已率先将采集到的人类数据应用于物流等真实场景。同时,灵初智能同步发布覆盖视觉、语言、触觉、动作的大规模真实世界多模态数据集 Psi-SynNet-v0。
02
Linux基金会:宣布推出智能体AI基金会AAIF
12月10日,Linux基金会正式宣布推出智能体AI基金会(Agentic AI Foundation,简称AAIF)。
据公告披露,AAIF定位为AI智能体(AI agents)相关开源项目的中立托管平台,Anthropic、OpenAI 与 Block 三家公司作为联合创始成员,三者协同以实现AI智能体与外部工具交互标准化,推动跨系统运行能力的统一。
目前,AAIF 基金会的成员名单包括亚马逊云科技、Anthropic、Block、Cloudflare、谷歌、微软、OpenAI、思科(Cisco)、IBM、甲骨文(Oracle)、Salesforce、SAP、Snowflake、Hugging Face 等。他们将首次携手,共同制定AI智能体的开放标准。
项目地址:https://agents.md
03
阿里巴巴:发布AgentScope Java v1.0开源框架
12月9日,阿里巴巴发布AgentScope Java v1.0开源框架,面向Java开发者提供企业级Agentic应用构建能力。
AgentScope Java v1.0采用ReAct(推理-行动)开发范式,支持高效工具调用与实时介入控制,具备安全沙箱、上下文工程、高效集成等企业级特性及完善的开发优化生态,覆盖智能体开发、部署、调优全生命周期,未来将持续优化上下文工程、支持全模态等。
04
腾讯:发布语言模型Tencent HY 2.0
近日,腾讯发布混元语言模型 Tencent HY 2.0 Think 和 Tencent HY 2.0 Instruct。
HY 2.0 采用混合专家(MoE)架构,总参数 406B,激活参数 32B,支持 256K 上下文窗口,在文本创作与复杂指令遵循等实用场景上表现突出。HY 2.0 Think 引入了精细的长度惩罚策略,平衡思维链的效率和效果,避免模型堆砌废话,实现了计算资源的更有效分配。
05
全国首个省级哲学社会科学AI大模型在武汉发布
近日,湖北省社科AI发展大会在武汉举行,全国首个省级哲学社会科学人工智能大模型——“湖北社会科学AI模型及其应用服务项目”正式发布。
本次发布的核心成果包括自主可控的“湖北社会科学人工智能底座平台”。该平台基于国产化技术架构,深度整合长江文明、荆楚文化等特色资源,通过构建动态知识图谱与精准训练机制,实现了内容生成的“有据可依、有源可溯”,从技术上有效破解了通用人工智能在社科领域容易产生的“内容幻觉”难题。
作为线下服务载体,全国首台社科智能交互机器人“荆哲”也在会上亮相。与此同时,项目打造了AI社科小程序,构建起一站式线上服务平台。
政策趋势
01
山东:印发《山东省人工智能产业高质量发展行动计划(2025-2027年)》
12月12日,山东省工业和信息化厅等八部门联合制定《山东省人工智能产业高质量发展行动计划(2025-2027年)》。
《行动计划》提出聚焦“大算力”、大数据、大模型、智能体、智能软硬件、智能服务、智能安全等重点领域实施人工智能技术创新、要素扩容、产业集聚、场景赋能和生态培育“五大行动”。到2027年,全省人工智能核心产业规模力争突破2000亿元,带动相关产业规模超万亿元。
原文链接>> 山东印发人工智能产业高质量发展行动计划
02
福建:印发《福建省有序推进算力基础设施发展若干措施》
近日,福建省数据管理局、福建省工业和信息化厅和福建省通信管理局印发《福建省有序推进算力基础设施发展若干措施》。
《若干措施》具体提出优化算力空间布局、规范数据中心项目建设、构建全省算力一体化服务体系、提升算力网络传输效率、推动云边端协同发展、强化数据存储力保障、提升公共算力服务水平、深化行业算力应用场景、推进算力与绿色电力融合、完善算网安全保障体系等十条工作措施。
声明:资料素材均来源官方媒体/网络,如有侵权,请联系删除。
✦
✦
END
南京新一代人工智能研究院
Nanjing Research
Institute of Next-generation Artificial Intelligence
南京新一代人工智能研究院,是中国信息通信研究院在人工智能、大数据领域投资组建的控股企业,是江苏省人工智能产业公共技术服务平台的落地运营单位。
研究院以“服务国家战略实施,促进地方产业升级”为导向,在人工智能和大数据领域,开展前沿技术研究、标准制定、评测工具开发、实验能力建设等工作,可为企业提供全方位的诊断、咨询、培训、评估服务。
联系方式
吴老师 17788386765(微信同号)
杨老师 15221125491(微信同号)

