近日,英伟达支持的初创公司 Starcloud 正式宣布,其发射的 Starcloud-1 卫星已在地球低轨道上成功运行英伟达 H100 GPU,并完成了人工智能模型的训练和推理任务。这是人类首次在太空轨道上完成此类任务。
Starcloud 的这一突破直接回应了 AI 与算力基础设施快速扩张带来的能源、冷却与资源压力问题。当 AI 模型规模不断扩大、数据中心对电力与水资源的需求急剧上升之时,构建能够长期稳定运行且能源自给的轨道计算平台成为行业关注的前沿方向。
据悉,这颗重约 60公斤、大小相当于一台小型冰箱的卫星于 2025 年 11 月搭载 SpaceX “猎鹰 9 号”火箭发射升空,随卫星一同进入轨道的是一块经过定制的英伟达 H100 GPU。根据公开资料,这块在轨设备的算力是此前任何进入太空的图形处理单元的 100 倍,为 AI 训练与推理提供了硬件基础。
在入轨后的数周内,团队并未急于进行高强度测试,而是先确保卫星的姿态控制和热管理系统稳定。在轨调试阶段,Starcloud 工程团队将两项不同性质的任务交付给这块 GPU 完成。
一是利用莎士比亚全集从头训练 NanoGPT 模型。NanoGPT 是前 OpenAI 研究人员 Andrej Karpathy 开发的轻量级大语言模型。Starcloud 将莎士比亚全集作为训练数据集上传至卫星,最终成功训练出了一个能模仿伊丽莎白时代戏剧风格生成文本的 AI 模型。
需要指出的是,NanoGPT 本身并非大规模商业模型,其参数规模与当前主流大模型仍有显著差距。但业内普遍认为,这次实验的关键并不在于模型大小,而在于完整验证了从前向计算、反向传播到参数更新的训练闭环,能够在轨道环境中稳定运行。
二是在卫星内部运行谷歌 DeepMind 的开源大型语言模型 Gemma,并在轨道环境下进行推理任务。
在部署 Gemma 模型后,卫星还向地球发来消息:“地球人,你们好!或者我更愿称你们为一群迷人的蓝绿集合体,让我们一起来探索隐藏在宇宙中的奇迹。”

(来源:社交媒体 X)
在轨完成模型训练与推理本身即为技术复杂度极高的工程。太空环境温度极端、辐射强烈且通信延迟是开展此类任务的主要挑战。Starcloud 工程团队表示,他们在硬件辐射防护、电源管理与散热设计方面做了大量优化,使得 H100 GPU 能稳定运行传统意义上属于地面数据中心工作负载的任务。
Starcloud-1 的任务还整合了卫星本身的状态数据,这意味着运行在轨的 AI 模型能实时读取高度、速度、方向等遥测信息,为推理任务提供实时输入。例如,系统能够回答查询卫星当前位置的问题,并返回诸如“我正在非洲上空,并将在 20 分钟后飞越中东”的情况说明。
Starcloud 的发展战略远不止于单颗实验卫星。该公司计划构建一个规模达 5 吉瓦(GW)的轨道数据中心,该设施预计配备宽高约 4 公里的太阳能发电板与散热组件,利用太阳能全天候无间断供电,以满足未来大规模 AI 训练和推理的能源需求。据 Starcloud 白皮书介绍,这样一个轨道数据中心产生的能源将比美国最大的单一发电厂还高出数倍,同时能源成本预计可降至现有地面数据中心的十分之一。
Starcloud 的愿景是尽可能将传统地面数据中心所能执行的所有任务迁移到太空,包括高性能计算、AI 模型训练、实时数据处理与全球监测服务等,这将彻底改变现有的算力基础设施格局。首席执行官 Philip Johnston 曾公开表示:“任何你能在地面数据中心做的事情,未来都应该能在太空完成。”

图 | 轨道数据中心网络架构(来源:Starcloud 白皮书)
Starcloud 费尽周折将数据中心搬上天的背后,是地面 AI 产业正面临的一场严峻的能源危机。
国际能源署(IEA)发布的报告中预测,到 2030 年,全球数据中心年用电量将接近 945 太瓦时(TWh),相当于日本一整年的用电规模,其中 AI 被明确列为最主要的增长驱动力之一。IEA 同时指出,在美国,数据中心可能贡献未来数年近一半的新增电力需求,其增长速度已明显快于电网扩容和新能源并网的节奏。

图 | 2024 年数据中心及设备类型电力消耗份额(来源:IEA)
能源之外,冷却与水资源正在成为另一道隐性瓶颈。以微软为例,其披露的数据显示,2022 年公司用水量达到 640 万立方米,同比增长 34%,主要用于数据中心冷却;多家研究机构指出,生成式 AI 工作负载是水耗快速上升的重要原因之一。
当电力、冷却和水资源同时成为制约因素,继续在地面无限扩张数据中心已不再是一个纯技术问题。在这一现实压力下,Starcloud 将目光投向轨道空间,其“轨道数据中心”的设想,也由最初的激进尝试,逐渐演变为绕开地面能源瓶颈的一条现实路径。
Starcloud 在白皮书中给出的论证直指地面 AI 基础设施的根本瓶颈:能源与冷却的不可持续性。该公司指出,地面数据中心扩张正受到电力、冷却和水资源的多重约束,而这些问题在 AI 算力快速增长背景下被进一步放大。相比之下,轨道空间在能源与散热条件上具备结构性优势。白皮书测算显示,太空太阳能阵列的发电容量系数可超过 95%,单位面积发电量约为地面系统的 5 倍,长期能源成本可低至 0.002 美元/千瓦时。同时,热量可通过辐射直接向深空释放,每平方米辐射板约可散热 770 瓦,从而避免地面数据中心对高能耗制冷和大量用水的依赖。在这一对比下,Starcloud 认为将部分算力迁移至轨道空间,具备长期成本和资源上的现实吸引力。
不过,轨道数据中心的商业化和规模化部署并非无风险。太空辐射、在轨维护困难、太空碎片风险及国际空间监管等问题仍是制约因素。行业分析师指出,这些挑战需要系统性工程解决方案和国际层面的政策协同。
Starcloud 的下一阶段计划,包括在 2026 年 10 月发射更多搭载 H100 及 Blackwell 的卫星,并引入云基础设施公司 Crusoe 的模块,以支持商业用户直接从太空部署与运行 AI 工作负载。
值得注意的是,谷歌、SpaceX 及 Blue Origin 等公司都已在探索太空算力和轨道数据中心的可能性。谷歌公开宣布将自研的 TPU 送入太空试验项目,预计在 2027 年进行早期测试,并计划在未来十年实现更广泛应用;SpaceX 也被认为可能将其星链卫星与轨道计算基础设施结合,以构建一个全球覆盖的在轨算力网络。
多位业内人士指出,这类尝试之所以在当下成为可能,与多项技术条件的同步成熟密切相关。一方面,可重复使用火箭显著降低了单次发射成本,使在轨算力试验具备试错空间;另一方面,单颗 AI 芯片的算力密度在近两年实现跃升,使得一颗中小型卫星首次具备承载有意义计算任务的能力。在算力、发射成本与地面能源约束同时逼近临界点的背景下,轨道数据中心迎来了现实试验窗口。
参考链接:
1.https://www.cnbc.com/2025/12/10/nvidia-backed-starcloud-trains-first-ai-model-in-space-orbital-data-centers.html
2.https://blogs.nvidia.com/blog/starcloud/
3.https://www.proactiveinvestors.co.uk/companies/news/1084214/anglo-asian-lifts-copper-output-after-upgrades-at-gedabek-plant-1084214.html
4.https://www.iea.org/reports/energy-and-ai/energy-demand-from-ai?utm_source=chatgpt.com
5.https://www.datacenterdynamics.com/en/news/microsofts-water-consumption-jumps-34-percent-amid-ai-boom/?utm_source=chatgpt.com
6.https://starcloudinc.github.io/wp.pdf

