大数跨境

量子位智库AI内参|4月20日

量子位智库AI内参|4月20日 量子位智库
2026-04-20
39
导读:阿里Qwen3.6-Max和HappyHorse-1.0要来了
分析师 卡洛琳
量子位智库 | 公众号 AI123All

今天是2026年4月20日,今天值得关注的AI要闻有:谷歌与Marvell合作开发2款芯片;曦望完成超10亿元人民币融资阿里Qwen3.6-Max预览版发布、HappyHorse-1.0规划测试、语音识别模型Fun-ASR1.5上线;加大AI业务,字节净利润承压下滑70%。

基础

谷歌与Marvell合作开发2款芯片

对于真正进入生产环境的模型而言,记忆的重要性可能要超过算力。上下文越变越长时,KV cache也会快速膨胀,它对HBM容量的占用和较差的访问模式使得HBM带宽利用率下降。

因此在推理场景下,算力通常不是先耗尽的,先耗尽的是内存容量、带宽和数据搬运能力

谷歌正与Marvell Technology洽谈开发两款新型AI芯片,其中一款为内存处理单元(MPU),设计用于与谷歌现有TPU协同工作,将把一部分搬数据和整理数据的工作从TPU主芯片里拆出来。

另一款则是专为AI推理场景打造的全新TPU。当前的TPU在架构设计普遍继承了训练优先的设计哲学,以大量计算单元搭配HBM,与推理任务的特性有所区别。新的TPU将是谷歌应对推理成本压力的重要方向。

Marvell此前已为亚马逊Trainium、微软Maia、Meta DPU等提供定制芯片设计,年化定制芯片收入约15亿美元。

国产推理GPU曦望完成超10亿元人民币融资

国内全栈自研AI推理GPU企业曦望完成超10亿元人民币融资,由杭州资本、普华资本等多家产业方战投、地方国资及头部财务机构共同参与。

自2025年初从商汤科技大芯片部门分拆独立以来,曦望已累计完成七轮融资、总额约40亿元,估值超百亿,成为国内首家纯推理GPU独角兽。曦望团队目前约300人,成员主要来自NVIDIA、AMD、昆仑芯、商汤等企业。联席CEO王勇为前AMD、昆仑芯核心架构师,拥有20年芯片研发经验。

跟随其专注推理的差异化路线,曦望已形成三代芯片产品矩阵。今年推出的S3采用国内首款LPDDR6显存方案,定位是推理的性价比之王。

模型

阿里:Qwen3.6-Max预览版发布、HappyHorse-1.0规划测试、语音识别模型Fun-ASR1.5上线

今日阿里巴巴发布了Qwen新一代旗舰模型Qwen3.6-Max的早期预览版,相比此前的Qwen3.6-Plus版本,该版本在智能体编程能力、世界知识储备和指令遵循方面有显著提升。

HappyHorse-1.0此前以匿名形式在Artificial Analysis的Video Arena榜单上登顶,文生视频赛道领先字节Seedance 2.0约92分,图生视频赛道同样排名第一。阿里宣布该模型将于4月27日开放API测试,5月正式商用,面向企业级客户。

语音识别大模型Fun-ASR 1.5也在今日推出,该模型单模型即可无缝覆盖30种语言、汉语七大方言体系及20余种地方口音。此前1.0版本已接入钉钉AI听记、DingTalk A1录音机等硬件,属于阿里端侧AI应用的技术更新。

加大AI业务,字节净利润承压下滑70%

字节出现净利润跌超70%而海外营收增长近50%的“剪刀差”。

区分来看,海外营收增长主要受惠于TikTok Shop GMV近70%的同比增长。而净利润率大幅下降则源于字节去年大幅增加了对AI业务的投入。

字节是国内互联网公司中最激进的AI基础设施投资者之一。市场普遍预计其2025年资本开支超过1500亿元,2026年可能进一步升至1600亿元,其中约一半会投入AI芯片采购,另一半投向IDC、网络和数据中心。

字节目前还没有成熟的自研芯片,因此仍在大规模采购先进GPU,并推进AI ASIC、自研推理芯片和服务器体系。

在非上市的情况下,字节无需每季度为利润率或短期财务表现向市场解释,因此更有可能在AI领域做出激进决策。且短期来看,GPU、IDC、模型训练和推理等费用都会越来越贵,利润率肯定会进一步承压。但长期来看,凭借模型产品的巨大使用量,它将同时拥有全球内容分发能力、AI基础设施和应用生态。

-👑 「2026年中国AI应用全景图谱报告征集启动-

「2026中国AI应用全景图谱」与「值得关注落地案例」评选启动征集!


👇扫码申报,让你的产品定义2026中国AI应用行业格局。



— 联系作者 —


—  —

【量子位智库】原创内容,未经账号授权,禁止随意转载。

点这里👇关注我,记得标星哦~


【声明】内容源于网络
0
0
量子位智库
连接AI创新,提供产业研究
内容 295
粉丝 0
量子位智库 连接AI创新,提供产业研究
总阅读6.5k
粉丝0
内容295