关键词:Yann LeCun 离职创业;Nano Banana Pro
Giants
Yann LeCun 离职创业瞄准高级机器智能;英伟达业绩炸裂打飞"AI 泡沫"
图灵奖得主 Yann LeCun 离职 Meta 创业
2025 年 11 月 20 日,Meta 首席 AI 科学家、图灵奖得主 Yann LeCun 正式宣布离职并创办新公司,目标是推动"高级机器智能"(AMI)研究。LeCun 在 Meta 工作 12 年,曾担任 FAIR 创始主任和首席 AI 科学家。他的离职源于与扎克伯格在 AI 战略方向上的分歧,包括内行被外行指导、公司内部管理混乱等问题。LeCun 的新公司将专注于世界模型研究,让 AI 系统能够理解物理世界、拥有持久记忆、具备推理能力并能规划复杂行动序列。Meta 将成为新公司的合作伙伴。这一离职标志着 Meta 在 AI 研究领域的重要人才流失,也反映了科技巨头在 AI 战略执行中面临的挑战。
英伟达业绩炸裂,黄仁勋驳斥 AI 泡沫论
英伟达第三季度财报再超预期,营收达 570 亿美元,同比增长 62%,净利润 319 亿美元,同比增长 65%。黄仁勋在电话会议上高调宣称 Blackwell 架构芯片"销量爆表",云端 GPU 已售罄,并直接驳斥了"AI 泡沫论"。数据中心业务创下 512 亿美元历史新高,同比增长 66%。英伟达预计四季度营收将突破 600 亿美元大关,达到 650 亿美元。在 AI 投资担忧情绪持续发酵的背景下,英伟达用业绩证明了自己的"算力卖水人"地位,有效缓解了市场悲观情绪。
英伟达 1000 亿美元投资 OpenAI 存变数
英伟达在最新季度财报中警告,不保证与 OpenAI 达成 1000 亿美元投资的最终协议。英伟达在 10-Q 文件中表示:"无法保证我们会就 OpenAI 合作机会或其他潜在投资签署最终协议,也无法保证任何投资会按照预期条款完成。"就在两个月前,黄仁勋与奥特曼共同宣布双方达成历史性合作协议,计划自 2026 年起分多年向 OpenAI 投资 1000 亿美元。这一变数为 AI 行业的投资前景蒙上阴影。
Models & Applications
谷歌 Nano Banana Pro 重磅登场;OpenAI 发布 GPT-5.1-Codex-Max
谷歌 Nano Banana Pro 重磅登场
谷歌发布最新图像生成模型 Nano Banana Pro(Gemini 3 Pro Image),结合 Gemini 3 Pro 的强大推理能力,实现 2K 和 4K 高分辨率图像生成。该模型支持 14 张参考图像融合,保持 5 个人物的一致性,具备前所未有的控制力和完美的文字渲染效果。Nano Banana Pro 还深度融合 Gemini 3 的知识库,能够生成基于最新数据的准确解释内容,并支持自动生成 PPT 页面。谷歌表示,该模型将在 Gemini App、Google Ads、Workspace 等多个产品中上线。
全球首个全自主 AI 操作系统 Parallax 开源
由 Gradient 团队打造的 Parallax 开源 AI 项目在 Product Hunt 冲上日榜第一,AI 产品周榜第四。Parallax 是全球首个"全自主 AI 操作系统",支持在 Mac、Windows 等异构设备上跨平台、跨地域部署大模型。该系统内置网络感知分片与动态任务路由机制,可在单机、本地多设备、广域集群三种模式间无缝切换。目前已兼容 Qwen3、Kimi K2、DeepSeek R1 等 40 余种开源大模型。在 M3 Ultra + RTX 4080 组合下,Parallax 推理 Llama-3.8B 相对 llama.cpp 推理速度提升 40%以上。
Meta"分割一切"进入 3D 时代
Meta MSL 实验室发布 SAM 3D 模型,实现图像分割结果直接转换为 3D 模型。SAM 3D 包含两个新模型:SAM 3D Objects 用于物体和场景重建,SAM 3D Body 专注于人体重建。SAM 3D Objects 能够从单张自然图像中实现基于视觉的 3D 重建和物体姿态估计,即使存在遮挡现象也能进行重建,性能显著优于现有方法。同时发布的 SAM 3 通过引入可提示概念分割功能,能够查找并分割由文本或示例提示定义的概念的所有物体,消除了固定标签集的限制。
OpenAI 发布 GPT-5.1-Codex-Max
OpenAI 发布 GPT-5.1-Codex-Max,突破上下文窗口限制,实现跨越数百万 token 的长时间连续工作,最长超过 24 小时。新模型在 METR 指标达到新 SOTA,有 50%的概率能够成功完成一项原本需要人类 2 小时 42 分钟完成的软件工程任务。GPT-5.1-Codex-Max 原生支持压缩,突破了上下文窗口限制,在接近限制时自动压缩对话获得新上下文窗口继续任务。在内部评估中,它能一次独立运行超过 24 小时,连贯处理数百万个 token。
字节豆包输入法正式上线
字节跳动 Flow 团队发布"豆包输入法",主打"以语音为第一入口"的 AI 输入法。该产品使用豆包同款语音识别模型 Seed-ASR,在公开测试集上相较国内同类模型错误率最多可降低约 40%,支持普通话及多种方言。豆包输入法还具备强大的中英文混说识别能力,能够智能添加标点符号。在键盘输入方面,模型会基于用户输入的句子结合上下文给出更完整的表达,实现"从打字到想好了帮我写"的体验升级。该产品目前支持 Android 下载,iOS 即将上线。
Physical Intelligence 发布"最强具身 VLA 大模型"
Physical Intelligence 发布机器人基础模型π*0.6,在连续制作 13 小时咖啡、折叠衣物等任务中成功率均达到 90%以上。该模型的核心贡献是提出 RECAP 训练方法:指导-用人类示范教基础动作,辅导-纠错指导修正错误,练习-从自主经验中不断优化。RECAP 让机器人能够从错误经验中学习,通过价值函数判断动作质量,用优势条件化把 RL 求解的策略更新重新写成监督学习问题。在最难的任务中,RECAP 将任务吞吐量提高一倍以上,失败率降低约 2 倍。
斯坦福华人博士具身创业首款产品亮相
Sunday 公司发布 Memo 家务机器人,售价 2 万美元(约 14 万人民币)。Memo 身高 1 米 7,体重 77.1 公斤,采用卡通小脸蛋、头顶棒球帽的白橙配色设计。该机器人基于 ACT-1 基础模型,能够稳放餐具进洗碗机、叠袜子、冲咖啡等。ACT-1 是首个融合长时序操控与基于地图的导航的端到端基础模型,仅需输入像素或观测值就能直接输出全身动作指令。Memo 采用技能捕捉手套进行数据采集,成本仅需 400 美元,人类数据能以近 90%的成功率转换为机器人可用数据。
谷歌 "下一代 AI IDE"被爆复制 Windsurf
谷歌发布 Antigravity IDE,号称"下一代 agentic 开发平台",但被开发者发现界面和行为方式高度类似 Windsurf。公开信息显示,谷歌曾以约 24 亿美元的价格获得 Windsurf 技术授权。Antigravity 与 Windsurf 的相似程度远超一般意义上的"风格借鉴",许多功能的呈现方式也高度一致。创始人 Varun 在公共叙事中主动与 Windsurf"切割",称 Antigravity 是完全不同的"Agent 原生开发平台"。然而,用户体验却问题多多:任务因"模型过载"中断,信用额度几十分钟内耗尽,连完整测试都难以完成。
清华团队把大模型表格理解推到极限
清华大学与稳准智能联合发布 LimiX 系列模型,首次在结构化数据领域做到"通用"。LimiX-16M 在分类任务中在 58.6%的数据集上取得最优结果,在回归任务中胜率能达到 62%。更重要的是,它第一次做到了真正的通用:一个模型在不进行二次训练的情况下,就能用于分类、回归、缺失值填补、高维表征抽取、因果推断等多达 10 类任务。LimiX-2M 虽然体积小,但性能惊人,甚至能在智能戒指上运行,在 2 核 CPU、4G 内存环境下单样本 375 毫秒就能完成推理。
快手可灵&港城大推出"视频作为答案"模型
快手可灵团队与香港城市大学发布 VANS 模型,开创"视频作为答案"新范式。该模型能够根据用户问题直接生成定制化视频作为回答,而不仅仅是文字描述。VANS 由视觉语言模型和视频扩散模型构成,通过 Joint-GRPO 强化学习策略进行协同优化。在程序性教学与未来预测两大基准测试中,VANS 性能全面超越现有统一模型,在 ROUGE-L 指标上相比最强统一模型取得近三倍的性能提升。该技术为 AI 交互提供了更直观、更个性化的解决方案。
全球AI政策与市场简讯
光轮智能完成数亿元融资,营收突破亿元大关
仿真合成数据公司光轮智能完成数亿元 A 轮、A+轮融资,投资方包括东方富海、九派资本等机构投资者,以及三七互娱、琥珀资本等产业方。该公司是全球唯一专注仿真合成数据的技术公司,也是全球首家把生成式 AI 融入仿真技术的公司。光轮智能的客户涵盖英伟达、谷歌、阿里、字节、Figure AI、1X Technology、智元机器人、银河通用,以及 Toyota、BOSCH、比亚迪、吉利等。有消息显示,光轮智能年营收已突破亿元大关。作为全球首家专注仿真合成数据的技术公司,光轮智能站在具身智能和世界模型的风口拐点上,为 AI 与物理世界交互提供关键技术支撑。
以上所有信息源自网络
THE END
关于 GMI Cloud
由 Google X 的 AI 专家与硅谷精英共同参与创立的 GMI Cloud 是一家领先的 AI Native Cloud 服务商,是全球六大 Reference Platform NVIDIA Cloud Partner 之一,拥有遍布全球的数据中心,为企业 AI 应用提供最新、最优的 GPU 云服务,为全球新创公司、研究机构和大型企业提供稳定安全、高效经济的 AI 云服务解决方案。
GMI Cloud 凭借高稳定性的技术架构、强大的GPU供应链以及令人瞩目的 GPU 产品阵容(如能够精准平衡 AI 成本与效率的 H200、具有卓越性能的 GB200、GB300 以及未来所有全新上线的高性能芯片),确保企业客户在高度数据安全与计算效能的基础上,高效低本地完成 AI 落地。此外,通过自研“Cluster Engine”、“Inference Engine”两大平台,完成从算力原子化供给到业务级智算服务的全栈跃迁,全力构建下一代智能算力基座。
作为推动通用人工智能(AGI)未来发展的重要力量,GMI Cloud 持续在 AI 基础设施领域引领创新。选择 GMI Cloud,您不仅是选择了先进的 GPU 云服务,更是选择了一个全方位的 AI 基础设施合作伙伴。
如果您想要了解有关 GMI Cloud 的信息
请关注我们并建立联系

