大数跨境

万卡集群要上天?中国硬核企业打造太空超算!

万卡集群要上天?中国硬核企业打造太空超算! 量子位
2025-11-29
469
导读:打破地面算力的物理边界
克雷西 发自 凹非寺
量子位 | 公众号 QbitAI

地面算力的“内卷”已突破大气层,迈向太空。

搭载英伟达H100芯片的Starcloud-1卫星由SpaceX猎鹰9号火箭送入轨道,迈出构建“太空超算”的关键一步。谷歌随后公布“太阳捕手”计划(Project Suncatcher),拟部署TPU卫星集群。

“太空超算”正从科幻走向工程现实,算力基础设施迎来空间位置的重大变革。

中国在该领域早已布局多年。自2019年起,中国科学院计算技术研究所、武汉大学、北京邮电大学等机构持续推进太空智能计算研究:

  • 中科院计算所作为国家算力研究主力,率先研制出极光POPS级星载智能计算载荷与天基大模型,并开展实际应用。
  • 武汉大学牵头“东方慧眼”智能遥感星座项目,采用光学+雷达+高光谱协同观测体系,突破星上智能处理与图像高效压缩技术。
  • 北京邮电大学主导“天算星座”建设,通过“北邮一号”“北邮二号/三号”验证在轨星地IP网络与星间激光通信能力。
  • ……

国星宇航联合之江实验室于今年5月成功发射全球首个太空计算卫星星座,并完成组网验证。

中科天算作为中国首批投身“天基计算”的商业航天企业,核心团队来自中科院计算所、航天部门及之江实验室,兼具互联网创新基因与航天工程严谨传统。

自2019年起,中科天算持续攻关星载高算力、在轨协同计算与天基大模型等关键技术,于2024年实现大模型在轨上注与部署,构建起“感知—决策”闭环的“太空智能链”。

公司致力于突破“超算上天”与“Al for Space”核心技术,推动智能计算软硬件系统及应用生态发展,现正式发布“天算计划”,目标是在近地轨道打造真正的“太空超算”,建立人类的“第二大脑”。

太空计算新范式:太空互联网应用生态

随着遥感精度提升和通信需求激增,“天标地算”模式面临带宽与时延瓶颈。当前天基信息基础设施被类比为地面互联网的1G时代,功能单一且成本高昂。

如同4G催生移动互联网爆发,天基网络升级将推动太空进入“4G时代”,支撑多样化应用生态。通过在轨道侧实现“感知-理解-决策”闭环,可大幅提升服务时效性与智能化水平。

以远洋渔业为例,未来可通过高光谱卫星监测海洋环境,结合导航定位与在轨AI分析,直接向渔民推送“东北方20海里处半小时后有金枪鱼群经过”等精准决策建议。

此类高实时性需求无法依赖地面超算响应,唯有将算力前置至轨道端才能实现即时处理与反馈。

中科天算认为,“天数—天网—天算”是必然演进路径:海量太空数据生成后,需经太空互联网连接,最终实现天基智能决策。

基于此愿景,“天算计划”旨在建设太空超算中心,目标在轨部署算力达10EOPS的万卡级超级智能体集群,由三大模块构成:

  • 100MW级能源舱:采用柔性光伏阵列与模块化储能系统,利用太空无昼夜优势实现无限绿色供电。
  • 10Tbps级通信舱:依托百束百G比特激光链路,实现太空节点与地空节点随遇互联,构建高速传输网络。
  • 10EOPS级算力舱:集成上万张高性能计算卡,在轨运行大模型任务,突破地面能耗与散热限制。

该计划试图建立“自然辐射冷却、无限绿色供能、全域算力共享”的新型太空计算范式。

物理绝境中的工程突围

将地面超算迁移至太空并非简单位移,而是在极端环境下进行系统重构。距地500公里轨道面临两大挑战:

  • 高能粒子辐射对芯片造成逻辑错误或物理损伤;
  • 真空环境中缺乏空气对流,导致高功耗芯片难以有效散热。

传统航天依赖抗辐射加固芯片,虽稳定性强但制程落后、性能低下,难以支撑现代AI运算需求。

中科天算发现先进制程芯片虽易发生“单粒子翻转”(即逻辑跳变),但更不易被彻底烧毁。据此提出软硬件互补容错机制:

采用多模冗余架构,多个计算单元互为备份并实时比对结果,以架构冗余换取商用先进芯片的可用性,使航天系统得以快速迭代,接轨地面芯片每18个月性能翻倍的节奏。

相较之下,真空环境下的散热问题更为严峻。无空气条件下热对流失效,热量仅能通过传导与辐射排散,而高密度芯片热流密度远超传统结构承受极限。

为此,中科天算研发混合主动-被动冷却架构:通过流体回路主动导出芯片热量,替代地面风冷方式;结合结构导热与辐射面板技术,在微重力条件下实现高效热管理。

该设计解决了工质在剧烈温差与失重状态下的循环与相变难题,保障高算力芯片长期稳定运行。

智能基础设施走向深空

太空超算不仅是商业竞争焦点,更是未来太空利用与深空探索的关键基础设施。

尽管存在担忧,但近地轨道(约500公里)在物理距离上相比跨区域地面调度更具时延优势,尤其适用于全球化低延迟服务。

太空算力具备广域覆盖能力,可为偏远地区车辆、无人机等终端提供持续算力支持,助力自动驾驶与低空经济发展。

同时,其天然具备抗毁性,在台风、地震等灾害导致地面设施瘫痪时,可作为应急备份中枢发挥作用。

长远看,随着人类向月球、火星拓展,在外星重建完整算力系统的成本极高。而在近地或深空轨道预置通用算力与通信节点,将成为连接地球与深空的数字桥梁。

从AI芯片初步验证到全尺寸GPU与万卡集群工程推进,每一项在真空与辐射中取得的技术突破,都在拓展人类数字文明的边界。

计算机科学与航天工程的深度融合,正在打破地面算力的物理局限,让算力如阳光般普照全球乃至深空。

【声明】内容源于网络
0
0
量子位
各类跨境出海行业相关资讯
内容 14866
粉丝 0
量子位 各类跨境出海行业相关资讯
总阅读151.3k
粉丝0
内容14.9k