大数跨境

9月17日丨每日AI简讯丨腾讯混元3D 3.0震撼发布!建模精度飙升3倍,真人手办自由来了

9月17日丨每日AI简讯丨腾讯混元3D 3.0震撼发布!建模精度飙升3倍,真人手办自由来了 久新数智
2025-09-17
0
导读:摘要信息



9agent.ai

点击蓝字 关注我们



每日AI简讯

2025-09-17


01

大模型

LLM

图片
  • Mini-o3 | 颠覆传统!Mini-o3 开源模型实现超长视觉推理,深度思考不再是难题

    字节跳动与香港大学联合推出开源视觉推理模型Mini-o3,突破传统模型仅1-2轮对话限制,测试阶段可扩展至数十轮推理。该模型通过VisualProbe数据集、迭代数据收集流程及超轮次掩码策略,在高难度视觉搜索任务中达顶尖水平,训练分冷启动监督微调和强化学习两阶段,表现超越现有开源模型,为多轮视觉推理发展提供新方向。

  • Lumina-DiMOO | 上海AI Lab推出Lumina-DiMOO,开创多模态生成与理解新局面

    上海人工智能实验室与多所高校合作推出新一代多模态生成与理解模型Lumina-DiMOO,采用创新的“全离散扩散架构”,突破传统模型在文本与图像处理上的局限。该模型通过对比学习技术整合文本、图像、音频等多模态数据,提升生成质量与效率,在图像生成等任务中表现出色,适用场景广泛,推动多模态AI技术发展。

  • LLaSO | 逻辑智能发布全球首个开源语音大模型框架 LLaSO

    北京深度逻辑智能科技有限公司近日推出全球首个完全开放、端到端的语音语言模型框架LLaSO。该框架支持开发者自由访问、修改和使用,降低技术门槛并提升语音AI透明度,具备多语言识别和学习能力,适用于智能助手、语音翻译等场景,未来计划举办活动促进社区合作。

  • VaultGemma | 谷歌DeepMind 发布 VaultGemma 具备差分隐私能力

    谷歌DeepMind推出新型语言模型VaultGemma,其为目前规模最大的具备差分隐私能力的开源模型,参数达10亿。该模型基于Gemma2架构,采用仅解码器的Transformer设计,通过添加随机噪声实现差分隐私,避免输出关联特定训练样本。虽生成能力保守,但隐私保护更强,团队将在Hugging Face和Kaggle开源代码,推动隐私安全与开源技术结合。

  • 混元3D 3.0 | 腾讯重磅发布混元3D 3.0模型 建模精度提升3倍

    腾讯在2025全球数字生态大会上发布混元3D 3.0大模型,其采用3D-DiT分级雕刻技术,建模精度较前代提升3倍,几何分辨率达1536³。该模型已集成于腾讯AI创作引擎并免费开放,同步上线腾讯云API。此外,腾讯推出混元3D Studio内测平台,并计划开源混元3D omni模型,推动3D创作技术在学术与工业领域落地。

  • 混元3D 3.0 | 腾讯混元3D 3.0亮相:攻克人脸雕刻难题,实现真人手办自由

    9月16日,腾讯在2025全球数字生态大会发布混元3D 3.0生成模型,建模精度提升3倍,几何分辨率达1536³,支持36亿体素超高清建模。该模型解决整体结构与局部细节生成难点,优化人物面部重塑,提升真实感,集成于混元3D AI创作引擎并开放腾讯云API,助力多行业3D内容创作,同时混元3D Studio启动内测,系列模型社区下载量超260万。

  • HunyuanImage 2.1 | 腾讯HunyuanImage 2.1强势登顶!开源2K文生图王者,秒变高清艺术大师?

    腾讯Hunyuan团队近日开源17B参数的文生图模型HunyuanImage 2.1,该模型基于DiT架构,支持2048x2048分辨率输出,在Artificial Analysis Image Arena排行榜超越HiDream-I1-Dev等模型,成为开源文生图新领军者。其升级了文本-图像对齐能力,引入Refiner精炼器和PromptEnhancer提示增强器,量化版本仅需24GB GPU内存即可生成2K图像,显著降低硬件门槛,推动开源AI图像技术迈向高分辨率、高保真阶段。

  • FunAudio-ASR | 阿里巴巴推出革命性语音识别模型FunAudio-ASR,降噪效果惊人

    阿里巴巴通义实验室发布端到端语音识别大模型FunAudio-ASR,其创新"Context模块"显著提升高噪声环境下识别准确率,幻觉率从78.5%降至10.7%。模型融合大语言模型语义理解能力,表现超越主流系统,还推出轻量化版本降低推理成本。目前已应用于钉钉"AI听记"、视频会议及DingTalk A1硬件,API上线阿里云百炼平台,助力提升会议效率。


02

产品&应用

Product Application

图片
  • Meta-雷朋 Display智能眼镜 | Meta科技年会前瞻:自带显示屏智能眼镜曝光 AI元宇宙多线并进

    Meta即将于9月17日至18日召开Connect 2025大会,扎克伯格将分享AI眼镜、AI及元宇宙愿景。会前曝光新款"Meta-雷朋 Display"智能眼镜,右眼镜片配显示器,支持地图、翻译等功能,预计年内发售,售价约800美元。此外,大会还将涉及AI聊天机器人、Llama模型动态及元宇宙软件更新等内容。

  • llm-optimizer | 新工具来袭!BentoML发布llm-optimizer,助你轻松优化LLM推理性能

    BentoML近日推出llm-optimizer工具,旨在帮助开发者高效优化大型语言模型(LLM)推理性能。该工具支持多种推理框架及所有开源LLM,可通过简单命令运行结构化实验、应用约束条件并可视化结果,帮助开发者分析模型延迟、吞吐量等指标,进行自动化性能探索,提升工作效率。

  • OpenAI Evals | OpenAI Evals 新增原生音频评估功能,简化语音模型测试

    OpenAI拓展其Evals工具功能,新增原生音频输入和音频评分支持,开发者可直接评估模型的音频响应,无需先文本转录,简化了语音识别和生成模型的评估流程。用户上传音频文件即可在平台评估性能,减少数据处理复杂性,提升结果准确性,适用于智能语音助手开发、语音识别系统评估等场景。

  • Mureka AI音乐创作平台 | 昆仑万维AI 音乐创作平台Mureka上线Agent Studio功能,让音乐创作变得触手可及!

    昆仑万维旗下AI音乐创作平台Mureka近日上线「Agent Studio」功能,旨在降低音乐创作门槛。用户只需描述想法(如情绪、场景),AI即可自动生成歌词、匹配风格并完成编曲,几秒内产出完整歌曲。目前该功能覆盖专辑制作、热点写歌、塔罗音愈等六大场景,支持个性化音乐创作,未来将持续扩展功能与场景,推动音乐创作生活化。

  • 通用机器人 | 五年沉寂后高调回归,OpenAI重组机器人团队剑指“通用机器人”

    OpenAI中断五年后重启机器人研究,正招聘人形机器人研究人员,新团队专注传感与原型设计,目标打造能执行通用任务的“通用机器人”以加速通用人工智能(AGI)实现。团队成员包括曾研究类人家用机器人的斯坦福研究员李成书,此前因训练数据不足暂停该项目,现随技术积累重启探索物理世界AI应用。

  • Microsoft365Copilot 聊天功能 | 微软办公应用新增免费 Copilot 聊天功能,提升用户办公效率

    微软宣布在Office应用中推出免费的Microsoft365Copilot聊天功能,面向所有Microsoft365商业用户,覆盖Word、Excel等多款应用,以侧边栏形式提供撰写文档、分析表格等服务,无需额外购买许可证。付费用户(每月30美元)可享跨文件推理、文件上传等更全面功能及更快响应,微软还计划10月整合销售、服务和财务Copilot至订阅中。

  • Qoder | 阿里Qoder推出付费订阅服务,Pro版每月20美元,助力AI自主编程

    阿里编程辅助工具Qoder在公测后推出付费订阅服务,包含Pro和Pro+版,Pro版月费20美元,提供无限代码补全、2000Credits等功能;Pro+版则含6000Credits。针对公测反馈,Qoder优化了Credits消耗,耐用度提升1/3,并上线上下文压缩功能。新用户可享两周免费试用及1000Credits。

  • 汽车AI合作 | 高通与哈曼携手打造更智能的汽车 AI 体验

    高通与哈曼在IAA Mobility汽车展上宣布合作,将高通的Snapdragon Cockpit Elite平台集成到哈曼汽车产品中,提升车内AI功能。合作涵盖实时ADAS可视化、情境智能及情感响应界面等,面向欧洲和中国车企,缩短开发周期并简化系统设计,通过中央计算架构减少功耗,为用户提供更个性化、直观的驾驶体验。


03

硬件&底层技术

Hardware Technology

图片
  • 腾讯云 | 腾讯云将全面升级云基础设施

    在2025腾讯全球数字生态大会上,腾讯云总裁邱跃鹏宣布全面升级云基础设施,以支撑Agent规模化落地和企业全球化发展。目前腾讯云在推理加速、Agent Infra和国际化布局取得突破,向DeepSeek等社区提交多项优化技术,并自研开源FlexKV多级缓存技术,降低大模型推理内存瓶颈,首字时延最多降70%。

  • 腾讯 | 腾讯AI能力全面开放,全面适配主流国产芯片

    9月16日,在2025腾讯全球数字生态大会主峰会上,腾讯公布多项AI技术和产品进展,并通过腾讯云全面开放AI落地能力及优势场景,助力AI在千行百业落地。腾讯云已全面适配主流国产芯片,同时投入软硬件协同全栈优化,整合不同芯片提供高性价比AI算力,并积极参与开源社区。

  • 腾讯 | 腾讯:AI能力全面开放,全面适配主流国产芯片

    9月16日,在2025腾讯全球数字生态大会主峰会上,腾讯宣布通过腾讯云全面开放AI落地能力及优势场景,助力AI在千行百业加速落地。针对算力问题,腾讯云总裁邱跃鹏表示,腾讯已全面适配主流国产芯片,并通过软硬件协同全栈优化战略,整合不同芯片提供高性价比AI算力。

  • 谷歌 | 谷歌在英国新建数据中心每年将排放 57 万吨二氧化碳

    谷歌在英国埃塞克斯郡瑟洛克规划新建超大规模数据中心,面积52公顷,预计每年排放超57万吨二氧化碳(相当于每周500个短途航班)。该项目为满足AI计算需求(英国预测2035年AI算力需求增13倍),但环保人士担忧其加剧温室气体排放及电力、水资源压力。目前英国数据中心占2.5%电力,预计2030年需求增四倍,政府认为需投资以避免国际竞争落后。

  • 腾讯 | 腾讯全新AI绘画升级!微调技术让生成图像美感提升300%

    腾讯推出全新AI绘画升级技术,通过微调方法提升生成图像的真实感与美学评分。其创新的"Direct-Align"技术减少梯度爆炸,实现全扩散过程优化;"语义相对偏好优化"(SRPO)让奖励信号受文本控制,灵活调整图像风格。实验显示,经SRPO训练的模型在真实感优秀率从8.2%升至38.9%,美学质量优秀率从9.8%升至40.5%,纹理更自然。

  • Meta AI | Meta AI 发布 MobileLLM-R1:轻量级边缘推理模型,参数不足 10 亿,性能提升显著

    Meta AI近日推出轻量级边缘推理模型MobileLLM-R1系列,参数范围140M至950M,专注数学、编码及科学推理。该模型采用分组查询注意力等架构优化,训练仅用约11.7%数据(4.2万亿token)即超越Qwen3-0.6B准确率,在MATH500等多项基准测试中表现优异,但在对话、常识推理等任务上弱于大型模型,且受非商业许可限制。

  • 英伟达 | 告别模糊!英伟达发布ViPE引擎 为空间AI提供高精度3D数据

    英伟达联合多校研究团队发布ViPE(视频姿势引擎)技术,旨在解决3D几何感知领域关键挑战,从复杂自然视频中高效精准提取3D信息。该技术支持多种场景和相机类型,采用多重约束混合方法确保高精度,性能优于现有技术,且能在单个GPU上稳定运行。团队还发布大规模标注数据集,为空间AI应用奠定基础。


04

行业动态&政策

Industry Trends Policies

图片
  • 2025云栖大会剧透来了!今年有哪些AI新看点?

    2025云栖大会将于9月24日至26日在杭州云栖小镇举行,主题为“云智一体·碳硅共生”,设三大主论坛和110余场聚合话题,预计2000余位嘉宾出席。展区分人工智能+馆、计算馆和前沿应用馆,将展示通义大模型、智能体应用、全栈计算能力及企业AI落地实践等,还有具身智能运动会、AI超级交易所等体验活动。

  • (图表·漫画)新华视点·关注AI造假丨“以谣生利”

    某公众号运营者钟某为蹭“海啸预警”热点,利用AI生成“30万居民撤离上海”等虚假言论,引发恐慌后被警方拘留。AI技术为虚假信息传播提供便利,带来社会治理挑战。9月15日,《人工智能安全治理框架》2.0版发布,中央网信办表示将完善监管制度,促进AI健康发展。

  • AI人才需求激增10倍,过半应届生岗位月薪超5万元

    脉脉《2025年AI人才流动报告》显示,2025年1-7月AI领域新发岗位量同比增超10倍,简历投递量涨11倍,平均月薪61,475元。算法类岗位紧缺,搜索算法供需比仅0.39。过半应届生岗位月薪超5万,42.66%岗位月薪5万-8万。字节跳动、小红书、阿里巴巴为热招企业前三,微软、平头哥等企业薪酬领先,62.99% AI人才计划一年内跳槽,被动求职占比过半。

  • 美国 FTC 调查 AI 聊天机器人对未成年人影响 引发广泛关注

    美国联邦贸易委员会(FTC)近日调查多家AI聊天机器人公司(如OpenAI、Meta、Alphabet),评估其对青少年的潜在风险。背景是OpenAI因涉少年自杀被诉后更新安全措施,Meta也调整政策避免向未成年人提供不当内容。专家指出,AI聊天机器人的可操控性与用户信任加剧问题复杂性,调查或提升透明度,但需平衡隐私与言论自由。

  • 谷歌强调人工智能摘要的价值与健康网络的重要性

    在纽约举行的AI峰会上,谷歌副总裁马克哈姆・埃里克森辩护搜索结果中使用AI摘要的做法,指出用户需求正从传统"10个蓝色链接"转向AI生成的上下文摘要。尽管AI摘要可能导致网站流量下降影响出版商收入,但谷歌强调将平衡AI摘要与传统搜索链接,维护生态系统健康,推动用户回到有价值内容。

  • 腾讯汤道生:立足“以人为本”,构建“好用的AI”

    2025年9月16日,腾讯集团高级执行副总裁汤道生在全球数字生态大会上表示,腾讯将打造“智能化”与“全球化”两大效率引擎助力企业增长。智能化方面,腾讯云发布智能体战略全景图,通过智能体解决方案、SaaS+AI、大模型技术升级构建“好用的AI”;全球化方面,从基础设施、技术产品、服务能力三方向助力企业出海,过去三年国际业务持续高双位数增长。


05

其他

Other

图片
  • Eightco Holdings 更名为 ORBS,专注于 AI 与人类身份验证

    Eightco Holdings Inc.(纳斯达克代码:ORBS)于2025年9月11日正式更名为ORBS,股票交易代码同步变更。公司近期完成2.7亿美元私募融资,用于实施全球首个Worldcoin财政战略,吸引World Foundation等多家机构参与。新任董事会主席表示,更名象征其在"人类证明"领域的领导地位,将通过零知识技术验证用户身份,保障安全隐私,构建数字信任体系。

  • 前 xAI 首席财务官加盟 OpenAI,担任新任业务财务官

    近日,OpenAI宣布任命前xAI首席财务官迈克・利伯托雷为新任业务财务官,其将负责管理公司资金与合同事务并向首席财务官汇报。利伯托雷曾在xAI参与50亿美元债务发行及数据中心扩建,任期仅四月。当前xAI多位高管离职,而OpenAI正进行结构调整,非营利部门将与估值超千亿的公共利益公司合并。



⬇️更多AI资讯关注我们⬇️



【声明】内容源于网络
0
0
久新数智
重塑生产力,开启人机协作新篇章!
内容 0
粉丝 0
久新数智 重塑生产力,开启人机协作新篇章!
总阅读0
粉丝0
内容0