分析师 王昕祎
量子位智库 | 公众号 AI123All
今天是2026年1月4日,值得关注的AI要闻有:Anthropic豪掷210亿美元,采购100万块TPU;MIT CSAIL团队新论文提出递归语言模型RLM;字节Seed新论文提出DLCM架构,概念级推理降低34%算力消耗;OpenAI首款硬件确定为AI笔,可语音交互并与ChatGPT同步。
基建
Anthropic豪掷210亿美元,采购100万块TPU
Anthropic花费210亿美元购买100万块TPU v7,创造历史性订单。与过往云租赁不同,此次Anthropic直接向博通买断TPU v7“Ironwood”整机。数据中心基建由昔日比特币矿企TeraWulf、Hut8、Cipher Mining提供,现场部署运维外包给Fluidstack。
此次采购后Anthropic将首次拥有并控制与云厂商脱钩的超算集群,不再支付“算力税”,开始跳出英伟达CUDA生态。公司称此举为“花小钱办大事”路线的延伸,用更低TCO获得与GB200接近的算力,把节省下的资金继续投向高质量数据与后训练推理优化,以在2026年竞赛中保持模型性能领先。
Anthropic此次选择跳过生产商谷歌,直接从博通采购TPU,原因在于公司需要能把TPU变成可售整机并实现规模落地的“打包服务”。过去博通只替谷歌做ASIC与封装,产品所有权、云门户、软件栈都留在谷歌内部;如今博通已提前攒齐定制ASIC、高速互连、先进封装与整机集成的全栈能力,可把TPU做成独立商品并负责机架交付。
此次交易,Anthropic实现一次性买断硬件主权,博通拿下AI基建历史性大单,谷歌TPU生态得到进一步推广,三方各取所需。
技术
MIT CSAIL团队新论文提出递归语言模型RLM
MIT CSAIL团队提出递归语言模型(RLM),把超长提示当作外部可编程对象,让模型用代码去“摸、切、再调用自己”,把有效上下文从百万级拉到亿级token,而成本不升反降。论文显示,在BrowseComp-Plus、OOLONG-Pairs等四项超长任务上,GPT-5与Qwen3-Coder以RLM方式运行后,准确率最高提升58个百分点,API花费仅为原方案1/3。
RLM无需改模型参数,只靠推理阶段把提示塞进Python REPL,模型即可动态拆分、过滤、递归调用子LLM,再把结果拼回最终答案。作者认为2025年是“推理模型年”,2026年将进入“递归模型年”, bitter lesson再次验证让模型自己管理上下文,比人类硬塞更长窗口更有效。
字节Seed新论文提出DLCM架构,概念级推理降低34%算力消耗
字节跳动Seed团队与英国曼彻斯特大学、加拿大Mila研究所、清华大学等机构联合发布Dynamic Large Concept Models(DLCM),首次把“概念级”理写进大模型主干:模型不再逐token预测,而是先在隐空间把文本切成可变长“概念”,再在压缩后的概念序列上做深度推理,最后用交叉注意力还原成词。
实验显示,在同等1T token训练、推理FLOPs持平的前提下,2.3 B参数的DLCM比1.3 B标准Transformer平均零样本得分高2.69%,其中推理型任务最高提升3%,而推理耗时下降34%,且序列越长、模型越大,节省越显著。团队同步提出压缩感知缩放律与解耦μP参数化,为异构架构提供零样本超参迁移,证明“把算力从冗余词片移向语义节点”可以成为下一代大模型的新Scaling路径。
DeepSeek新论文提出双随机约束残差连接改进方案,提升训练稳定性
DeepSeek发布新论文《mHC: Manifold-Constrained Hyper-Connections》,梁文峰亲自署名,首次对何恺明2016年提出的残差连接进行“十年级”升级。
论文提出残差连接靠“恒等映射”保证信号无损跨层传播,成为Transformer系大模型默认拓扑;但去年字节跳动提出的Hyper-Connections(HC)通过把残差流从C维扩到n×C维并引入可学习映射,虽带来增益,却破坏了恒等性,27B模型训练到1.2万步时出现损失飙升、梯度峰值放大3000倍的“爆炸”风险。
为此,作者把残差映射约束为“双随机矩阵”——行、列和均为1的非负矩阵,形成Birkhoff多面体流形,使复合映射范数≤1且封闭,信号增益被压到1.6;配合Sinkhorn-Knopp投影、TileLang融合内核、重计算与DualPipe流水线重叠,n=4时仅增6.7%时间。3B/9B/27B MoE实验显示,mHC在BBH、DROP等任务上再涨2%左右,且训练全程稳定,验证“性能与稳定可兼得”。
应用
OpenAI首款硬件确定为AI笔,可语音交互并与ChatGPT同步
OpenAI首款硬件最终落定为“AI笔”,形态接近iPod Shuffle,重量仅10余克,由前苹果首席设计官Jony Ive操刀,富士康越南工厂代工,内部代号“Gumdrop”。
产品定位是无屏、口袋级AI语音入口,可本地跑定制模型,可把任意手写、语音或环境信息实时转文本并同步至ChatGPT,随后通过配对手机完成追问、摘要、任务执行等操作。产品预计2026-2027年正式上市。
CEO奥特曼承认,现有手机、电脑都是“前AI时代”遗产,弹窗、点亮屏幕、切换App让人焦虑,他要的是像“湖畔小屋”般安静、只在需要时轻触的交互。而一支随时捏在手里、无需点亮、不抢占视觉注意力的笔,恰好成了这一哲学的最小载体。
为把端到端体验握在自己手里,OpenAI去年以65亿美元打包收购Jony Ive的硬件公司io,一次性补齐55人工业设计及供应链团队,也创下公司最大单笔并购。
空间智能硬件创企无穹创新完成数千万元融资
空间智能硬件创企无穹创新宣布连续完成天使+、Pre-A、Pre-A+三轮数千万元融资,由李泽湘XBOTPARK、甘洁知行基金、金沙江联合等头部硬科技基金共同下注。
公司成立于2020年底,核心产品MetaCam是一套“通用硬件+整机”双轮驱动的空间智能基础设施:将自研多传感器融合算法封装进巴掌大的模组,可即插即用于轮式、足式、人形机器人及无人机,实现无GPS场景下的厘米级定位与语义建图。
团队把原本为室内自主飞行研发的全栈技术,先收敛成手持3D扫描仪做现金流,再反向输出给机器人本体,形成“工具级-模组级-整机级”递进式商业路径。MetaCam Air系列已交付数千台,海外测绘、国内建筑BIM、电力巡检等场景开始批量复购;无人机导航套件完成工程样机,收获数十家意向订单,预计2026年下半年集中交付。
公司创始人潘杰出自港科大3126实验室,曾拿大疆全额奖学金,核心成员多来自RoboMaster冠军队,兼具学术与量产经验。此轮融资将主要用于算法持续迭代、高端人才招募及全球渠道铺设,目标在1754亿元规模的空间智能赛道中抢占标准化感知入口。
— 联系作者 —
— 完 —
-👑 年度「AI 100」产品榜单开启招募-
和量子位智库一起在日新月异的AI产品市场中厘清背后脉络,把握未来动向,找到真正代表中国AI实力的巅峰力量!
【量子位智库】原创内容,未经账号授权,禁止随意转载。
点这里👇关注我,记得标星哦~


