量子位智库AI周报｜2026第13周- 大数跨境

首页

量子位智库AI周报｜2026第13周

量子位智库

2026-03-30

导读：市场对推理成本极其敏感

分析师卡洛琳
量子位智库 | 公众号 AI123All

2026年第13周，本周AI产业的新闻展示了核心玩家对产业链闭环的深度掌控以及对推理成本的极致压榨。

半导体产业形成如今的协作格局有诸多复杂原因，但随着AI和算力的竞争加剧，芯片领域反而呈现出“去代工化”的整合趋势。Arm正式从IP授权跨向硅片量产，马斯克启动Terafab项目想要攻克2nm晶圆厂，单纯的自研芯片设计已经不足以抵抗巨头们害怕被掣肘的阴影。

在模型算法侧，TurboQuant对KV Cache 6倍的压缩能直接引发存储芯片股的震荡，市场对于推理成本的敏感度已超过模型规模。

本周，Agent落地应用的进展更加现实。字节的DeerFlow2.0登顶GitHub以及MiniMax、阶跃星辰相继推出的Token包月订阅方案，表明Agent正通过降低调用门槛加速切入生产力市场。但巨头的步伐并不一致，OpenAI意外宣布关停Sora视频业务以备战IPO，而Meta则在裁员的同时，通过吸纳Dreamer团队全力转向个人AI智能体研发。

基础

Arm进军量产硅片市场，推出自研数据中心芯片AGI CPU

Arm宣布业务从IP授权延伸至量产硅片领域，推出首款面向AI数据中心的自研CPU Arm AGI。该芯片专为代理式AI设计，采用台积电3nm制程，集成136个核心，性能据称达到x86平台的2倍以上。

Meta、OpenAI、Cloudflare等已承诺采用。Arm预计该业务未来5年内每年将带来150亿美元新增收入，助力实现250亿美元的年度销售目标。

Terafab晶圆厂可生产机器人、AI及太空数据中心芯片

马斯克启动“Terafab”项目，在美国得克萨斯州奥斯汀建设2nm晶圆厂，目标实现年产1太瓦（TW）的算力产能，约为当前全球AI总算力的50倍。

Terafab内部将设两个晶圆厂，分别生产用于特斯拉汽车与Optimus机器人的边缘芯片，以及用于SpaceX轨道AI数据中心的抗辐射高性能芯片。厂区80%的产能将投向太空AI基础设施，以突破地面算力的能源限制。

为此，特斯拉已在加州和奥斯汀招聘首批岗位，包括光刻模块工艺工程师等，年薪8.8万至33.8万美元，要求10年以上先进半导体经验，适应高强度工作。SpaceX也在其Starlink工厂招聘封装、测试等领域人才，该厂去年获2.8亿美元投资扩建。

全球半导体供应链是一个难以撼动的系统，未来可见的对算力的需求催生了马斯克频繁的整合动作。通过垂直整合芯片制造、封装与自有业务，马斯克试图摆脱对传统代工厂的依赖。

模型

谷歌TurboQuant算法：压缩6倍AI推理内存需求，引发存储芯片股震荡

谷歌研究院发布的TurboQuant算法可将大模型推理过程中的KV Cache压缩至少6倍，速度提升8倍且精度零损失。

该技术采用双阶段压缩框架，无需训练即可直接应用于Gemma、Mistral等开源模型，并在长上下文测试中获满分。

消息导致美光、西部数据等存储芯片巨头股价下跌，市场担忧AI推理内存需求将显著收缩。

英伟达PivotRL框架：以较低计算成本实现高精度智能体后训练

英伟达提出PivotRL强化学习框架，平衡长程智能体任务中的计算效率与泛化能力。

该框架通过筛选轨迹中的“关键节点”进行局部在线采样，并采用功能性等价奖励机制。实验显示，PivotRL在分布外准确率上平均提升10.04个百分点，现已应用于英伟达Nemotron-3-Super-120B-A12B模型的生产级智能体后训练流程。

世界模型：妙动科技DiT4DiT；LeCun团队LeWorldModel

1. 妙动科技联创杨硕发布DiT4DiT模型，实现世界模型在人形机器人首次落地

妙动科技发布的DiT4DiT模型首次将世界模型应用于人形机器人控。

该模型通过“中间去噪”机制，使机器人无需等待视频生成即可获取物理规律指导决策，解决了传统模型无法理解动态规律的缺陷。DiT4DiT在LIBERO基准测试中成功率达98.6%，数据效率提高10倍以上，且仅需单相机即可在RTX4090上实现6Hz推理。

联创杨硕曾任大疆技术总监、特斯拉Optimus团队工程师，2025年初与高建荣联合创立妙动科技，团队技术路线已全面转向强化学习。

2. LeCun团队开源LeWorldModel：首个端到端稳定训练的极简JEPA世界模型

由Yann LeCun参与的团队开源了LeWorldModel(LeWM)方案，基于联合嵌入预测架构（JEPA），从原始像素直接预测未来状态。

该模型精简为编码器与预测器，有效解决了表征坍塌问题。其参数量仅1500万，在单张L40S显卡上几小时即可完成训练，规划速度比大型预训练模型方案快48倍，并展现出对物理世界的深层理解。

Anthropic最新模型Claude Mythos曝光

Anthropic因内容管理系统配置失误，导致约3000份未发布资产暴露于公开数据存储中，其中包括代号“Claude Mythos”的新模型详情。

Mythos内部命名为Capybara，是Anthropic迄今最强大模型，在编程、推理和网络安全测试中较Claude Opus 4.6显著提升。内部文件警示该模型在网络安全领域“远超任何其他AI模型”，可能引发AI驱动攻击浪潮，因此计划优先向网络安全人员开放。

曝光后Anthropic已将数据存储设为私密，归因为CMS人为配置错误，未涉及核心基础设施或客户数据。

ARC Prize基金会发布ARC-AGI-3智能体“智力”基准测试

该基准测试包含超1000个交互式网格世界游戏，要求AI在零先验、零指令下自主探索并完成任务。测试采用动作效率评分，486名人类受试者全部通关，中位耗时仅7.4分钟。

然而，当前最先进AI表现惨淡：谷歌Gemini 3.1 Pro Preview以0.37%得分居首，OpenAI GPT 5.4得0.26%，Anthropic Opus 4.6得0.25%，xAI Grok-4.20得0分，显示当前AI在泛化推理上仍远未达到人类水平。

基金会为此次测试设立了总计超过200万美元的奖金池，希望推动具备真正自主学习和适应能力的AI系统研发。

应用

Token Plan：MiniMax推出全模态Token Plan，阶跃星辰发布Step Plan包月方案

MiniMax宣布将其Coding Plan升级为Token Plan，推出全球首个支持全模态的订阅计划。Plus及以上用户可在保留编程模型用量的基础上，额外调用视频、语音、音乐、图像生成等全系多模态能力。

同日，阶跃星辰发布Step Plan包月订阅方案，主打OpenClaw及AI Coding场景，起步价49元/月，开发者社区限时半价，且全档位不设普通版与极速版区分，将高速推理作为标配。

Agent商业化在寻求成本破局之路。此类包月方案使Agent的调用成本变得清晰且可负担，有助于将Agent推向生产力市场。其中MiniMaxToken Plan的打包订阅降低了构建多模态Agent的门槛；而阶跃星辰在OpenClaw等Agent产品爆发的前提下，将高速推理作为标配的策略更表明了对开发者的争夺。

Agent：字节DeerFlow 2.0登顶GitHub；OpenClaw连续更新并集成国产模型；Claude推出Computer Use

1. 字节DeerFlow 2.0：智能体运行时登顶GitHub

字节跳动开源的DeerFlow 2.0迅速登顶GitHub Trending榜首，该版本由研究框架升级为智能体运行时基础设施。它支持在独立的Docker容器中运行任务，并能并行调度多个子智能体，内置深度研究与数据分析等功能。

其核心优势在于为Agent提供了安全的操作环境与权限，满足了开发者对于落地执行能力的预期，但任务质量仍依赖底层模型。

2. OpenClaw修复API兼容性故障，深化国产模型集成

OpenClaw连续发布3.22和3.23两个重大更新。3.22版本进行了“史上最大”架构迁移，但因暴力拆除旧API导致UI崩溃及插件失效。团队随后在12小时内紧急推出3.23版本修复故障，并正式接入DeepSeek和Qwen系列模型。

此次事件虽暴露了质量管控风险，但也展示了团队对国产AI生态的深度拥抱与极速响应。

3. Claude推出计算机使用功能，实现手机远程指派桌面任务

Anthropic为Claude推出“计算机使用”功能，允许Claude直接控制Mac电脑模拟人类操作，如点击鼠标、打字及运行开发工具。该功能遵循“权限优先”原则，执行操作前需经用户授权。通过与Dispatch功能配合，用户还能使用手机远程向电脑端Claude指派任务，实现高效的跨设备协作，目前该功能处于早期研究预览阶段。

华为盘古大模型负责人王云鹤离职，被曝投身Agent创业

华为诺亚方舟实验室主任、盘古大模型负责人王云鹤在朋友圈发文确认离职，结束了其在华为近9年的职业生涯。王云鹤出生于1991年，博士毕业于北京大学，自2017年以实习生身份加入华为，历任高级工程师、算法应用部部长，并于2025年3月接任诺亚方舟实验室主任，负责盘古大模型的研发。其学术成果丰硕，谷歌学术引用量超3.3万次，曾主导轻量级神经网络架构GhostNet及DLLM智能体等研究。

关于离职后的去向，尽管其本人未在官宣中明确，但业内普遍消息称他将投身Agent创业，并已在寻求融资。

空间智能企业群核科技通过港交所聆讯

杭州六小龙群核科技（Manycore Tech Inc.）已通过港交所上市聆讯，并更新了聆讯后资料集，IPO进入最后冲刺阶段。

群核科技旗下拥有空间设计平台酷家乐、海外版Coohom以及空间智能解决方案SpatialVerse。

其财务数据显示，2025年公司营收达8.2亿元，毛利率高达82.2%，并实现了从亏损到盈利的跨越，全年经调整净利润为5710万元。群核科技证明其基于SaaS的空间设计软件业务具有扎实的造血能力，并非单纯依赖融资。

此外，该公司正通过SpatialVerse等平台，将业务从辅助人类设计延伸至助力具身智能训练。在该类前沿领域，群核科技的优势是之前业务积累的大量三维空间数据。

OpenAI宣布关停Sora视频生成业务

OpenAI宣布关停其AI视频生成应用 Sora，涉及独立App、API及ChatGPT内部功能。此举距离其发布2.0版本仅半年，且导致迪士尼终止了10亿美元的投资与合作计划。

OpenAI表示这是为2026年Q4的IPO做准备，公司资源将集中于生产力及企业级应用。

与此同时，字节跳动Seedance 2.0与快手可灵等中国AI视频产品正加速发展，2025年可灵ARR规模已达2.4亿美元。

Meta：已启动新一轮数百人裁员；吸纳Dreamer团队加速个人AI智能体研发

Meta证实新一轮裁员涉及Facebook、Reality Labs等多个部门，将优化资源配置以匹配AI战略。

Reality Labs累计亏损超700亿美元，Meta正将资源从元宇宙向AI进行“断臂求生”式转移。公司计划在2026年投入高达1350亿美元建设AI基础设施，并组建实验室应对OpenAI等竞争对手的直接威胁。

与裁员计划同时进行的，是Meta宣布吸纳AI创业公司Dreamer的核心团队加入超级智能实验室。Dreamer希望能让用户通过自然语言构建个人AI智能体，其团队由前Stripe及Meta高管组成。

谷歌：Gemini推出记忆导入功能

Gemini新功能允许用户将其他AI应用中的个人记忆、偏好设置及完整对话历史迁移至平台。Gemini将“历史对话”更名为“记忆”，反映其向个人化智能助手的演进。

该功能提供两种实现路径：通过提示词引导原AI生成用户画像摘要，复制粘贴即可同步偏好；或上传最大5GB的ZIP格式历史对话文件，实现完整聊天记录无缝衔接。谷歌表示导入数据用于优化服务，用户保留完全数据控制权，可随时查看或删除。该功能将降低模型切换成本，提升用户留存与获取能力。

具身智能：周凯文加入诺因智能，公司估值超20亿；它石智航A1机器人创吉尼斯纪录

1. 天才少年加入诺因智能

前华为天才少年周凯文加入具身智能创业公司诺因智能，担任合伙人兼算法主管。

诺因智能成立于2025年7月，专注于消费级家庭机器人，成立不足一年已连续完成三轮融资，估值超20亿元。其核心团队博士占比超三分之二，人才密度极高。自研的KnowinBrain模型在Embodied Arena评测中斩获总榜第一，在空间感知与具身推理等单项上亦位列榜首。

2. 它石智航机器人创吉尼斯纪录

它石智航A1机器人以一小时完成105次亚毫米级线束装配的成绩创造吉尼斯纪录，中国具身智能在工业精密操作领域实现突破。

其核心支撑是自研的通用具身大模型AWE3.0，该模型将视觉、语言、触觉与动作为统一输入，具备强大的跨场景泛化能力。公司同时推出SenseHub数采套件，发起具身数据星火计划，倡导以人为中心的数据采集范式。

马斯克系：特斯拉发布Optimus灵巧手进展，传递招聘需求；xAI创始团队全部离职；SpaceX筹备创纪录IPO

特斯拉发布宣传视频，展示在Optimus机器人灵巧手研发上的技术突破，表示下一代手部已接近人类功能水平，并正为大规模量产做准备。视频中Optimus展示了行走、叠衣服和物品分类能力。

特斯拉将该机器人视为重塑劳动力经济体系的重要产品，目前正在全球范围内积极招聘人工智能与制造领域的人才。

与此同时，xAI联合创始人Manuel Kroiss将离职，最后一位创始人Ross Nordeen也于周五离职。离职潮始于2024年，多位xAI核心成员转投OpenAI或流向学术界。马斯克承认初期架构存在问题，正从特斯拉和SpaceX引入员工重建团队，并亲自接管数十名下属。近期他也正通过从Cursor等公司挖掘高管来组建新核心阵营。

而已收购xAI的SpaceX，正在筹备创纪录IPO，计划将30%份额分配给散户投资者，远超美股IPO市场5%至10%的常规水平。此次IPO预计募资500亿至750亿美元，公司估值或超1.8万亿美元

承销商采用精细化分工：美银负责美国本土零售分销，花旗统筹国际零售与机构配售，摩根士丹利通过E*TRADE服务散户投资者，打破传统投行竞争惯例。

分发权博弈：Google正在将搜索结果的新闻标题替换为AI生成的标题

Google正在传统搜索结果中测试一项新功能：利用AI改写新闻标题，替换掉媒体原本撰写的标题。此前，Google已在Discover中测试过类似功能，并在一个月内将其从小规模实验升级为正式功能。目前测试中，AI生成标题有时会改变原文的措辞甚至语气，且未向用户标注“已被AI重写”。

Google方面认为这样可以使标题与新闻结果更加相关，最终这项功能是否能推行得看可能要看Google、内容创作方与监管方之间的协议。但AI供应商对分发权的控制意图是显而易见的，不论目的是留住用户还是截流商业价值。

同时，是否所有功能都适合加上AI值得商榷。新闻标题的例子中，内容创作方已经开始担忧用户获取的信息有误会造成影响。

首批参与ChatGPT广告试点的广告主也反馈，OpenAI提供的AI广告效果甚微。尽管试点周期已过半，OpenAI没有足够的广告库存、广告排期的效率低下、也没有成熟的平台来追踪转化率等关键数据。少数拿到点击数据的广告主发现，用户对AI对话中的广告点击意愿目前还不到搜索的七分之一。

但OpenAI称该业务年化经常性收入已超1亿美元，计划扩展至加拿大、澳大利亚和新西兰市场。对于广告主的不满，OpenAI回应需要优先保证用户体验。

苹果开放Siri，结束ChatGPT独家合作

在即将于WWDC发布的iOS 27中，用户可通过“Extensions”功能选择ChatGPT、Claude或Gemini等不同AI模型打破了自2024年ChatGPT在Siri中的垄断地位。尽管Siri将支持多模型切换，

不过，谷歌仍将深度嵌入苹果生态，即便用户选择其他聊天机器人，Gemini仍将处理Siri和Apple Intelligence中的特定任务。

亚马逊：开发预装Alexa并整合AI能力的智能手机

亚马逊研发代号为“Transformer”的新款手机，试图通过深度集成AI与Alexa语音助手，打破苹果和谷歌应用商店的垄断。团队正评估传统智能机与极简功能机两条路线。

亚马逊此举仍是为获取用户使用行为与消费数据闭环，反哺其电商业务。结合其自研的Trainium芯片与大模型，亚马逊试图利用语音加Agent的全新操作方式重新切入硬件市场。

认知

黄仁勋专访：Scaling Law远未触顶，AGI已实现

黄仁勋在Lex Fridman播客中表示Scaling Law依然有效，并呈现预训练、后训练、推理时及智能体扩展四条并行路径。他认为合成数据将解决高质量数据耗尽的担忧，并预测未来智能将被商品化，全球GDP中计算占比将提升100倍。此外，他认为程序员群体将扩大至10亿人，强调在智能泛滥的时代，人性特质才是核心价值。

— 联系作者 —

— 完 —

【量子位智库】原创内容，未经账号授权，禁止随意转载。

点这里👇关注我，记得标星哦～

【声明】内容源于网络