
用五把开源密钥解锁了新的游戏规则
前 言
当硅谷用天价GPU筑起技术壁垒,当闭源模型沦为资本游戏的工具,DeepSeek却用一场开源风暴撕开铁幕。
“557万美元训练千亿参数大模型、300行代码重构矩阵计算、一部手机跑实时AI对话——这不是未来科技,而是开发者手中触手可及的现在!” 全球开发者正用DeepSeek的代码,将AI的权柄从实验室拉回人间。
1. 技术民主化:从“实验室垄断”到“人人可建大模型”
2. 成本重构:训练成本从“烧掉一个硅谷”变成“众筹一杯咖啡”
3. 地缘破局:中国技术栈首次在全球AI基建中扮演规则制定者
4. 伦理进化:开源透明性VS闭源黑箱,AGI时代的人类选择
回顾DeepSeek这五天开源的内容,几乎都和AI Infra相关。
第一天,FlashMLA架构,DeepSeek独创MLA架构的高性能版本,直接突破H800计算上限;
第二天,DeepEP, 第一个用于MoE模型训练和推理的开源EP通信库,提供高吞吐量和低延迟的all-to-all GPU内核;
第三天,DeepGEMM,一个通用矩阵乘法库,仅300行代码,是V3/R1训练推理关键秘籍;
第四天,连开三源,创新的双向流水线并行算法DualPipe、用于MoE的负载均衡算法EPLB,以及训练和推理框架的性能分析数据;
第五天,3FS和Smallpond,高效的分布式文件系统和以之为基础的数据处理框架。并且主打的就是极度压缩成本,降低消耗的同时将各种硬件的性能全部发挥到极致。

- 颠覆性:H800 GPU算力榨出580 TFLOPS,推理延迟从秒级压至毫秒级,网友实测:“用RTX 4090跑130B模型,生成速度比喝水还快!”
- 行业地震:实时生成场景(如游戏NPC对话、直播弹幕互动)成本直降80%,《黑神话:悟空》团队已将其用于动态剧情生成。
- 破局点:全球首个支持国产昇腾910B的全栈MoE通信库,FP8通信带宽暴砍75%,国产芯片集群训练效率提升210%。
- 开发者说:“以前用英伟达卡组MoE集群像拼乐高,现在用DeepEP简直是磁悬浮拼接!”
- 极致优化:核心代码仅300行,手机端显存占用降低50%,网友复现:“代码简洁得像数学公式,我的本科毕设居然跑通了千亿模型!”
- 边缘革命:非洲开发者用二手手机+DeepGEMM搭建本地医疗问答AI,离线响应速度<0.3秒。
- 性能狂飙:千亿参数模型训练有效算力从42%跃至89%,流水线气泡砍70%,网友调侃:“这优化力度,连英伟达的散热风扇都懒得转了!”
- 开源生态:已有团队将其用于训练“全球最小10B参数法律大模型”,准确率超GPT-4专业版。
- 硬核数据:180节点集群吞吐6.6TiB/s,KVCache查找峰值突破40GiB/s,网友实测:“加载200TB训练集比解压一个RAR文件还快!”
- 破圈应用:联合NASA开源社区,用于地外探测数据的实时AI分析。
训练成本仅为硅谷同规格模型的1/5,推理API价格低至0.00096美元/百万token(比GPT-4便宜97%),《经济学人》称:“DeepSeek让中小企业的AI预算从‘卖房创业’变成‘奶茶自由’。”

周鸿祎曾直播演示“用10张国产芯片跑通MoE模型”,喊话硅谷:“东方技术哲学的精髓——用数学暴力推翻硬件霸权!”
近期多国对DeepSeek采取了一系列禁令措施:
意大利数据保护局于2025年1月30日紧急下令要求停止处理意大利公民数据并启动调查,导致其应用在本地应用商店下架;
美国多个政府机构(如NASA、国会、海军)及得克萨斯州禁止在政府设备使用DeepSeek,国会更提出法案将下载或使用该技术定性为犯罪,最高可判20年监禁;
澳大利亚政府及多所高校全面封禁DeepSeek在政府系统和校园设备的使用;
韩国多个政府部门以“敏感信息泄露风险”为由屏蔽访问,教育部和高校同步实施禁用政策;
印度财政部也禁止公务员在执行公务时使用该工具。
这些禁令主要基于数据安全、隐私风险及技术主权等理由,反映出全球对AI技术监管的强化趋势。
- 杨立昆(Meta首席AI科学家):“这是开源生态首次证明:开放协作不仅能追赶闭源系统,还能重新定义游戏规则。”
- 《自然》杂志社论:“DeepSeek的透明性远超闭源黑箱模型,这或许是通往AGI的唯一伦理路径。”
- 英伟达匿名工程师:“他们甚至比我们更懂如何压榨Hopper GPU的每一丝晶体管——这代码让我想起年轻时在车库捣鼓超频的激情。”
开发者可根据需求组合使用这些项目:
推理场景:FlashMLA + DeepGEMM + 3FS,实现端到端低延迟推理。
MoE训练:DeepEP + DualPipe + EPLB,构建高效分布式训练流水线。
数据处理:3FS + Smallpond,优化PB级数据预处理与存储。





这些项目已通过DeepSeek生产环境验证(如日均百亿级推理请求),且采用MIT协议,可快速集成至现有技术栈。
结 语
DeepSeek开源周通过五大项目实现了硬件效率突破、生态开放共建和行业成本重构,被业界视为“AI基础设施的标杆”。其开源策略不仅加速技术民主化,更推动国产芯片和边缘计算发展,成为全球AI竞争格局中的重要变量。
声明:文章内容仅供参考,不构成投资建议或其他任何形式的专业建议。对于因使用、引用、参考文章内容而导致的任何损失,我方不承担任何责任。
文章内部分图源网络,如有内容、版权和其他问题,请及时与我们联系,我们将在第一时间处理。
如果您有兴趣了解更多,可以持续关注我们的公众号资讯,以及即将推出的“2025SIE全球供应链创新论坛”。同时,欢迎各位读者向我们投稿,分享您的行业经验和成果。
活动预告:
2025 SIE 全球供应链创新论坛 现已预定于 2025年3月22日 在上海举办。

在本次博览会上,您将了解到企业如何在供应链重塑的过程中抓住新机遇,通过变革不断优化各个环节。我们将探讨人工智能、自动化、先进分析和协作网络等技术的快速发展,如何为您的企业提供强大的支持,帮助优化运营、提升决策质量并提高效率。同时,我们也将为企业构建更加可持续、高效且协作的供应链提供创新思路。
我们期待您的参与,让我们一起碰撞思想,共同推动供应链的变革,塑造更加具有韧性和创新精神的未来。
欢迎转发分享活动,若有多人填写您的信息作为推荐人,更有好礼相送!
合作媒体:

往期推荐:


