今日热点导览
- 谷歌或加码入股 Anthropic,估值或破3500亿美元
- 苹果或每年砸10亿美元引入Gemini升级Siri
- 谷歌Gemini 3 Pro预览现身Vertex AI,上下文至百万Token
- IBM拟裁撤数千岗位,业务重心转向AI与软件
- 伦敦高院裁定Stable Diffusion训练不构成侵权
- Google Cloud发布Vertex AI代理构建套件,强化企业级AI代理
- Snap与Perplexity达成4亿美元合作,营收与股价双利好
- Comfy Cloud公测上线,浏览器秒开Stable Diffusion
资本与战略动向
谷歌或加码入股 Anthropic,估值或破3500亿美元
谷歌与Anthropic展开新一轮资本与资源谈判,方案或含可转债、扩大TPU云资源或参与新轮定价;此前谷歌已投30亿美元并持股约14%,与亚马逊的140亿美元布局形成对峙,基础模型两大阵营对立加剧。
IBM拟裁撤数千岗位,重心转向AI与软件
全球员工约27万的IBM将进行个位数百分比裁员,聚焦利润率更高的软件、云与生成式AI平台watsonx;基础设施部门受影响较大,反映大厂普遍通过组织精简押注AI与云的行业趋势。
OpenAI企业客户破百万,企业席位达700万
ChatGPT for Work、Enterprise席位快速增长,近两个月商业席位从500万跃至700万;与Slack、Drive、GitHub等生态的深度对接推动企业提效,代码与自动化模型使用量显著攀升。
OpenAI CFO:暂不考虑IPO,优先推进增长与研发
OpenAI强调保持战略灵活性,专注技术与业务扩张而非短期资本市场操作;先前传闻的中期上市时间表并非当下优先事项。
Pinterest押注开源AI:视觉推荐成本降至十分之一
微调后的开源大模型在视觉AI任务上接近闭源表现、但成本仅为其十分之一;在广告与电商压力下,Pinterest以“开源+场景微调+端侧优化”重塑长期ROI。
新模型发布
谷歌Gemini 3 Pro预览现身Vertex AI,上下文至百万Token
开发者日志显示将提供分层上下文能力:标准约20万Token,高级可至100万;多模态推理、代理式能力和长文档处理强化,面向金融建模、生物仿真与自动化代理等企业场景。
科大讯飞发布星火 X1.5:国产算力MoE效率大幅提升
基于国产算力平台,星火 X1.5在MoE全链路训练效率上突破;语言、知识问答、逻辑与数学表现与国际主流看齐,多语言支持超130种,官方称总体能力已达GPT-5的95%以上。
MiniMax M2走全注意力路线:工程效率与生态成熟度权衡
团队认为现阶段线性/稀疏注意力生态与工具链尚不完善,全注意力在复杂工业应用中更稳;同时前瞻布局新注意力范式以应对未来算力与数据扩张。
新产品发布
Google Cloud发布Vertex AI代理构建套件:ADK与托管引擎上线
新ADK API+托管代理引擎支持快速搭建与扩容;引入自愈重试、多语言(Python/Java)、可观测与评估工具、代理身份与策略边界,强化企业级治理与稳定性。
HeyGen新一代视频翻译:唇形毫秒级对齐、多说话人分离
多模态语境理解摆脱直译,侧脸/遮挡场景下唇形精准同步;“声纹+视觉”识别多角色并匹配更贴脸音色,支持170+语言变体,显著降低全球化本地化成本。
Comfy Cloud公测:浏览器秒开ComfyUI/Stable Diffusion
免安装、按秒计费、与开源生态实时同步,内置SDXL、Flux、ControlNet、AnimateDiff等;高性能GPU集群支持超大图与动画工作流,提供200+模板降低上手门槛。
小鹏汽车发布人形机器人 IRON:仿生架构+2250 TOPS
仿人脊柱、仿生肌肉与柔性皮肤,22自由度实现精细动作;三枚AI芯片2250TOPS支持多模态与行为决策,率先落地博物馆、4S店等场景,并与宝钢探索工业巡检。
讯飞星火AIPC落地:端云协同的AI原生PC平台
将星火大模型能力下沉至终端,强调低时延与隐私;与多家行业龙头签署合作,覆盖教育、城市治理、政企数字化,推动“AI+行业”深融合。
谷歌地图接入Gemini语音助手:更自然的出行导航
语音一喊即到、个性化推荐,Android/iOS数周内陆续开放;强化路线规划与偏好匹配,让地图从“导航工具”升级为“出行顾问”。
Chrome移动端上线AI模式按钮:一键会话式搜索
iOS/Android新标签页直达AI模式,支持文本/语音/图片多轮查询与摘要;逐步扩展至160个国家并支持多语,部分代理化能力面向订阅用户。
Gemini AI“深度研究”:整合Gmail/Drive/Chat自动产出报告
制定多步骤研究计划并跨网页与内部文档检索,生成可定制报告并可导出或一键生成AI播客;桌面端先行,移动端即将上线。
钉钉AI表格支持1000万热行:“AI存算一体”架构
与阿里云ADB-PG联合打造,支持多表关联、实时计算与AI分析一体化;品牌在“双11”高并发场景下免“分表”,统一管理提升决策与执行效率。
QQ浏览器推出“AI+”悬浮小窗:用完即走
以不打扰为设计原则,按页面类型智能推荐“视频/网页总结”等工具;无需插件与跳转,在小窗内完成翻译、总结、订阅助理等多任务。
前Meta团队推出Stream智能戒指:按压录音+音乐控制
内置高灵敏麦克风与触控,按住即录、松开即止;配套App与AI整理笔记、低声私密记录不打断思路,支持控制播放/音量,预售价249–299美元。
苹果或引入Gemini升级Siri:私有云部署+端云协同
传每年约10亿美元引入定制Gemini模型,优先在私有云运行以守住隐私;复杂任务上云,敏感请求由端侧小模型处理,升级版Siri预计明年春季亮相(计划可能微调)。
企业案例
Paytm携手Groq:LPU推理加速交易与风控
借GroqCloud与自研LPU实现高吞吐/低时延推理,优化交易处理、反欺诈与用户互动;AI音响支持11种印度语言,实时反馈经营数据。
Snap与Perplexity达成4亿美元合作:AI搜索嵌入Snapchat
Perplexity将在一年内以现金+股权支付4亿美元,功能预计2026年初上线;Snap三季度营收与利润超预期并启动5亿美元回购,股价大涨。
冰岛联手Anthropic推进校园AI:教师减负与多语支持
Claude将用于备课与课堂辅助,覆盖偏远地区并保障冰岛语等母语地位;示范项目旨在形成可复制的教育AI范式。
软银与OpenAI在日本成立合资公司:企业AI本地化
SB OAI Japan推出“Crystal intelligence”,软银率先内部落地并已为员工部署250万个定制ChatGPT实例,推动日本企业的AI转型实践。
小鹏与宝钢探索工业巡检应用:IRON从商服走向工业场景
基于人形机器人与具身智能的行业协同,向更高可靠性、强安全性的工业监测与巡检拓展,验证商服到工业的跨域可行性。
行业突破
讯飞AI软硬一体:90dB噪声下识别仍达98.69%
通过AI算法与硬件协同实现语音增强、声源定位与回声抑制;办公本与翻译硬件在远场/高噪声环境表现显著提升,支持“百变声音复刻”。
上海AgiBot:10分钟教会机器人复杂制造工序
人机远程操作+强化学习在真实工况中自我改进,G2人形机已在3C产线装配;强调“训练速度”成为制造业竞争新维度。
MotionTrans框架:机器人零样本学新技能
VR设备精细采集人手关键点与第一视角视频,3213条演示数据集支撑;将人类动作优化映射到机器人关节角,实现安全稳定复现。
UNO-Bench发布:系统化评测多模态大模型
覆盖44类任务与5种模态组合,1250全模态+2480单模态样本;多步骤开放问答与通用评分模型令自动判分准确率达95%,中文应用导向明显。
监管与法律动态
伦敦高等法院裁定:Stable Diffusion训练不构成“侵权复制”
法院认定模型参数不等同于作品拷贝,AI训练提取的是统计关系非直接再现;商标方面对旧版本生成带Getty类水印的情形给出有限支持,但驳回名誉受损与额外赔偿请求。
其他新闻
xAI被曝要求员工提交面部与声音等生物识别信息,用于训练可含成人内容选项的“虚拟女友”Ani,内部引发隐私与滥用担忧;公司称为实现更“拟人化”交互所需,员工质疑深度伪造风险。
小鹏汽车围绕“IRON/XPENG IRON/铁人”等商标加速布局,并通过“一镜到底”走秀与现场拉链拆解展示结构,正面回应真实性与技术质疑,强化其在具身智能与机器人赛道的品牌心智。
宇树科技创始人王兴兴判断:机器人大模型相当于“ChatGPT前1–3年”的阶段,真正的“ChatGPT时刻”应是在陌生日常场景中,机器人仅凭语音/文本即可完成约80%任务;要实现需补齐物理建模、数据闭环与实时学习等系统性能力。
更多AI资讯请关注公众号或点击阅读原文查看

