报告发布日期:2025年11月10日
报告名称:《国信证券-人工智能周报(25年第45周):谷歌即将发布Nano Banana2,月之暗面发布Kimi K2 Thinking》
证券分析师:张伦可 陈淑媛 王颖婕 刘子谭 张昊晨
证券投资咨询执业资格证书编码:S0980521120004 S0980524030003 S0980525020001 S0980525060001 S0980525010001
核心观点
人工智能动态:
1)产品应用:谷歌 Gemini AI 推出深度研究功能,通过Google Gemini重塑邮件与文件研究体验;谷歌Gemini平台即将发布Nano Banana2图像生成技术升级版;OpenAI Sora 正式登陆 Android 并推“付费角色”新功能;微软正式推出首款自家 AI 图像生成器 MAI-Image-1;月之暗面发布最强思考模型 Kimi K2 Thinking;科大讯飞推出全国产算力星火 X1.5,AI 技术再升级;网易云音乐正式推出大模型音效“AI调音大师”。
2)底层技术:美团LongCat-Flash-Omni 正式发布,开启全模态实时交互新时代;科大讯飞发布AI软硬一体方案。
3)行业政策:工业和信息化部办公厅发布《关于开展2025年人工智能产业及赋能新型工业化创新任务揭榜挂帅工作的通知》。
风险提示:政策风险,疫情反复的风险,短视频行业竞争格局恶化的风险,宏观经济下行导致广告大盘增速不及预期的风险,游戏公司新产品不能如期上线或者表现不及预期的风险等。
AI相关网站流量数据
公司动态
谷歌 Gemini AI 推出深度研究功能,通过Google Gemini重塑邮件与文件研究体验 。
11月7日,据搜狐新闻报道,谷歌推出的 Gemini AI 新功能 '深度研究' 可以从 Gmail、Google Drive 和 Google Chat 中提取信息,生成智能研究报告。该功能支持用户自定义内容并导出到 Google 文档或生成播客,提升了市场分析和竞争对手报告的效率。
谷歌Gemini平台即将发布Nano Banana2图像生成技术升级版。
11月5日,据AIbase基地报道,谷歌正加紧准备发布其备受期待的AI图像生成模型Nano Banana2,内部代号为“GEMPIX2”。此消息源于Gemini官方网站上最近新增的一则公告。业内人士预计该模型将在未来几周内正式发布。这标志着谷歌在生成式AI(Generative AI)领域的创新步伐正在加快,旨在为用户提供更高效、更准确的图像创建体验。
OpenAI Sora 正式登陆 Android 并推“付费角色”新功能。
11月5日,IT之家消息,OpenAI 的 AI 视频应用 Sora 已正式登陆 Android 平台,扩展了其在全球短视频创作领域的影响力。该应用在 Google Play 商店上架,并引入了‘角色 Cameo’功能以应对深伪和版权问题,同时计划未来实现商业化。Sora在Android平台的首日下载量达到47万次,表现出色,同时其iOS版本因地区限制和邀请制导致下载量相对较低。
微软正式推出首款自家 AI 图像生成器 MAI-Image-1。
11月5日,IT之家消息,微软推出了其首款自主研发的 AI 图像生成器 MAI-Image-1,已在 Bing 图像创作工具和 Copilot 平台上线。该模型在食品、自然场景以及光影效果上表现出色,并且在速度和质量之间取得了平衡,提升了用户的创意实现效率。MAI-Image-1 还将用于 Copilot 的文本转语音平台 Copilot Audio Expressions 的“故事模式”中,为 AI 生成的音频故事配以同步生成的图像内容。
月之暗面发布最强思考模型 Kimi K2 Thinking。
11月6日,据月之暗面官网报道,月之暗面发布了其最新思考模型Kimi K2 Thinking,该模型在智能代理和推理能力上实现了显著提升,是Kimi系列迄今能力最强的开源思考模型。它能够自主进行多轮工具调用和深度思考,无需用户干预,标志着AI技术向更高层次的自我学习和适应能力发展。
科大讯飞推出全国产算力星火 X1.5,AI 技术再升级。
11月6日,在第八届世界声博会暨2025科大讯飞全球1024开发者节发布会上,科大讯飞发布基于全国产算力的讯飞星火X1.5深度推理大模型。星火 X1.5 大模型在技术上实现了重大突破,不仅在多语言支持和性能上达到国际先进水平,还为国内开发者提供了更强大的技术支持,进一步提升了中国 AI 技术在全球市场的竞争力。
网易云音乐正式推出大模型音效“AI调音大师”。
11月5日,据搜狐新闻报道,网易云音乐推出的“AI调音大师”功能,利用AI技术动态解析歌曲特征,实现智能适配音效。用户可实时查看音效波谱,并根据个人喜好选择不同的调音关键词,提升听感体验。实时效果试听功能也为用户提供了极大的便利。在用户选择歌曲播放前,可以通过一键对比原声和调音效果,轻松试听不同音效的效果。
底层技术
美团LongCat-Flash-Omni 正式发布,开启全模态实时交互新时代。
11月3日,It之家消息,美团正式发布 LongCat-Flash 系列模型,其中LongCat-Flash-Omni 是业界首个实现“全模态覆盖、端到端架构、大参数量高效推理”于一体的开源大语言模型。综合评估结果表明,LongCat-Flash-Omni 在全模态基准测试中达到开源最先进水平(SOTA),同时在文本、图像、视频理解及语音感知与生成等关键单模态任务中,均展现出极强的竞争力。
科大讯飞发布AI软硬一体方案。
11月6日,在第八届世界声博会暨2025科大讯飞全球1024开发者节发布会上,科大讯飞发布了AI软硬一体解决方案,通过算法与硬件的深度融合,在高噪声、远场等复杂环境下实现了精准识别与理解。该方案显著提升了多款AI硬件的降噪与识别性能,并推出了基于星火语音大模型的“百变声音复刻”技术,推动个性化语音创作进入普及阶段。
行业政策
工业和信息化部办公厅发布《关于开展2025年人工智能产业及赋能新型工业化创新任务揭榜挂帅工作的通知》。11月5日,工业和信息化部办公厅发布任务内容:面向人工智能产业发展底座、“人工智能+制造”、智能产品装备、共性基础支撑等重点方向,发掘培育一批技术创新强、应用落地快、典型示范好的关键技术和产品,加快人工智能与工业深度融合应用,高水平赋能新型工业化。
重点事件预告
11月06日-11月09日:世界互联网大会乌镇峰会
11月20日-11月21日:2025世界计算大会
风险提示
政策风险,疫情反复的风险,短视频行业竞争格局恶化的风险,宏观经济下行导致广告大盘增速不及预期的风险,游戏公司新产品不能如期上线或者表现不及预期的风险等。
免责声明
国信互联网张伦可团队-成员介绍
张伦可
国信互联网首席分析师
分析师资格编码:S0980521120004
香港科技大学投资管理学硕士、加州大学欧文分校经济学学士,2021年加入国信证券经济研究所,2023年9月起担任互联网行业首席分析师,聚焦研究国内互联网巨头和人工智能产业趋势的发展。加入国信证券以前,曾任职于中信建投国际(香港)、Roth Capital(美国),具备海内外券商从业经历擅长挖掘困境反转的机会,聚焦研究先进生产力、具备独特性和可持续性发展的企业。重点覆盖腾讯、美团、阿里、Meta、微软等企业。
陈淑媛
国信证券互联网分析师
执业资格编码:S0980524030003
新加坡南洋理工大学硕士。覆盖公司:腾讯控股、美团、快手、网易、BOSS直聘腾讯音乐、云音乐、微博、知乎、美图、Adobe等。
王颖婕
国信证券互联网助理分析师
清华大学硕士,主要研究电商、互联网医疗等。覆盖公司:阿里巴巴、美团、京东集团、拼多多、京东健康、阿里健康、唯品会、SEA等。
刘子谭
国信证券互联网助理分析师
上海交通大学机械与动力学院硕士,研究方向人工智能、机器学习。4年新能源汽车、智能驾驶工作经验。覆盖公司:META、微软、英伟达、谷歌、亚马逊、百度集团、金蝶国际等。
张昊晨
国信证券互联网助理分析师
执业资格编码:
S0980525010001
上海财经大学金融硕士,研究方向美股科技、电商等。覆盖公司:亚马逊、谷歌等。

