分析师 王昕祎
量子位智库 | 公众号 AI123All
今天是2026年2月25日,值得关注的AI要闻有:谷歌前TPU团队芯片创企MatX获5亿美元融资;Meta与AMD签署6吉瓦AI芯片采购协议并获10%股权认购权;谷歌提出Deep-Thinking Ratio思考深度新指标评估推理质量;清华系Meta FAIR研究员张鹏川加盟OpenAI投身世界模拟与机器人研究;宇树科技发布新一代四足机器人Unitree As2;英伟达发布开源人形机器人运动控制模型SONIC。
基建
谷歌前TPU团队芯片创企MatX获5亿美元融资,LLM专用芯片融合SRAM与HBM架构
AI芯片初创公司MatX宣布完成5亿美元B轮融资,由Jane Street和Situational Awareness领投,Stripe联合创始人、前OpenAI研究员Leopold Aschenbrenner及AI科学家Andrej Karpathy等知名人士参投。
MatX由两位谷歌TPU核心工程师创立:CEO Reiner Pope曾任谷歌TPU软件技术主管,参与过PaLM大模型训练效率优化;CTO Mike Gunter是谷歌TPU硬件首席设计师,主导过谷歌首个硬件加速项目。
MatX正在开发名为MatX One的LLM专用芯片,采用创新的“可拆分脉动阵列”架构,试图融合SRAM优先设计的低延迟特性与HBM高带宽内存的长上下文处理能力,试图寻找延迟与吞吐的平衡点,精准响应当前LLM工作负载特性,如长上下文、Agent多轮交互。公司计划于2027年通过台积电代工量产,主要面向头部AI实验室销售。
当前AI芯片市场正经历从通用架构向专用架构的关键转折。英伟达GPU凭借CUDA生态垄断训练市场,但其设计兼顾图形、科学计算等多元场景,在LLM推理中存在算力冗余。
以MatX代表的新一波初创公司选择“做减法”,砍掉与Transformer无关的计算单元,专为LLM的矩阵运算和注意力机制优化,在特定场景下可实现10倍能效提升,代价是失去灵活性。一旦模型架构发生根本性变革(如非Transformer架构兴起),专用芯片可能面临淘汰风险。
Meta与AMD签署6吉瓦AI芯片采购协议并获10%股权认购权
Meta Platforms与AMD宣布达成一项多年期战略合作协议,Meta将采购总计6吉瓦算力的AMD Instinct系列GPU,首批基于MI450架构的定制芯片预计于2026年下半年开始交付。
该协议还包含股权安排,AMD向Meta发行最高1.6亿股认股权证,相当于公司股本的10%,行权价仅为每股0.01美元,但归属条件与出货里程碑及AMD股价表现挂钩。
这是继2025年10月与OpenAI达成类似协议后,AMD再次斩获超大规模AI基础设施订单。值得注意的是,Meta在宣布此交易前一周刚与英伟达扩大合作,承诺采购数百万颗Blackwell及下一代Rubin GPU,显示其正通过多元供应商策略降低供应链风险。
这笔交易标志着AI芯片市场从英伟达一家独大向多极竞争加速演进。目前英伟达在数据中心GPU市场占据约80%-92%的份额,但AMD通过连续签下OpenAI和Meta两大标杆客户,正在打破“CUDA生态不可撼动”的行业共识。
技术
谷歌提出Deep-Thinking Ratio新指标,用思考深度替代长度评估推理质量
谷歌与弗吉尼亚大学联合发布的一项最新研究对当前大语言模型推理能力的评估方式提出了根本性挑战。强调思考深度在LLM模型推理质量评估中的重要性。
研究团队指出,业界长期以来将生成token数量作为衡量模型推理投入的核心指标存在严重缺陷——数据显示token数量与推理准确率平均呈现负相关(r=-0.59),即模型输出越长反而越可能出错。
这种现象源于“过度思考”问题:模型陷入无意义的循环论证、重复冗余步骤或放大初始错误。为此,研究者提出深度思考率(Deep-Thinking Ratio, DTR)这一全新度量标准,当某个token的预测在深层transformer层中持续发生显著修正后才收敛,该token即被标记为“深度思考token”,从而通过追踪模型内部各层预测分布的稳定性来识别真正的推理投入。
实验表明,DTR与准确率的相关系数高达0.828,显著优于基于长度或置信度的传统指标。基于这一发现,团队进一步开发了Think@n推理策略,通过早期筛选高DTR样本并淘汰低质量生成,在保持甚至提升性能的同时将推理成本降低约50%。
标志着AI领域对推理本质的理解正在发生深刻转变。2024年以来,以OpenAI o1系列、DeepSeek-R1为代表的推理模型普遍采用test-time scaling策略,即通过生成更长的思维链来提升复杂任务表现。然而此项工作揭示了该范式的内在局限。
清华系Meta FAIR研究员张鹏川加盟OpenAI投身世界模拟与机器人研究
清华大学数学系校友、前Meta FAIR核心研究员张鹏川宣布加入OpenAI,转向世界模拟与机器人学方向。
张鹏川本科毕业于清华数学系,后获加州理工学院应用与计算数学博士学位,曾在微软研究院担任首席研究员并主导计算机视觉与多模态智能研究。
2022年加入Meta FAIR后,张鹏川主导了Segment Anything 3(SAM 3)项目及Llama 3、Llama 4的视觉grounding工作,推动Llama系列在视觉常识推理领域达到人类水平。其谷歌学术被引量超3.4万次。此次加入OpenAI世界模拟团队,标志着其研究重心从视觉理解转向底层世界模型与物理智能的融合探索。
应用
宇树科技发布新一代四足机器人Unitree As2 性能翻倍,开放二开生态
宇树科技发布第四款四足机器人Unitree As2,产品动力性能约为上一代Go2的两倍,峰值扭矩达90N.m,极限速度5m/s,空载续航超4小时,负载15kg时续航超13km,具备IP54防雨水等级。
产品采用18kg轻量化机身设计,可适应河沟、雪地、丛林等复杂地形,并开放二次开发生态,可选配7轴灵巧机械臂,站立负载可达65kg。
宇树科技2024年四足机器人销量达2.37万台,公司已完成IPO上市辅导工作,拟申请境内上市。创始人王兴兴表示,当前机器人技术水平接近10岁小孩,大规模应用预计3-10年内实现,公司目标是让机器人真正干活,从而解放生产力。
英伟达发布开源人形机器人运动控制模型SONIC,仅42M
英伟达研究团队发布了名为SONIC的开源人形机器人全身运动控制模型,该模型基于4200万参数规模的Transformer架构,通过大规模强化学习训练实现对Unitree G1机器人的实时控制。
与当前主流的三层MLP小模型不同,SONIC的核心创新在于将运动追踪识别为可扩展的基础任务,利用超过1亿帧动作捕捉数据提供的密集帧级监督信号,替代了传统针对每项技能手工设计奖励函数的做法。
研究团队使用128块GPU在Isaac Lab仿真环境中进行训练,物理模拟加速达到10000倍,3天内完成9000 GPU小时的训练量,模型在50组多样化真实世界动作序列上实现了100%的零样本迁移成功率。
SONIC支持VR全身遥操作、单目摄像头视频流实时模仿、自然语言文本指令、音乐节奏控制以及与VLA基础模型GR00T N1.5的集成,在移动操作任务中达到95%成功率,展现出单一策略处理多模态输入的通用控制能力。
— 联系作者 —

— 完 —
【量子位智库】原创内容,未经账号授权,禁止随意转载。
点这里👇关注我,记得标星哦~

