众所周知
阿里云有高人
阿里云硬核自研技术
这个豪横的标题就是个褒奖

全家福中的盘古
是用来支持阿里全球
布局的分布式自研存储系统

一看到分布式
就代表炫技的时刻到来
从大厂到互联网到开源方案
如何满足性能/可用/SLA是功力的体现

盘古将RDMA技术
引入存储系统的无损网络
采用存储与网络共设计的方式
有效解决存储需求与网络带宽不匹配的现状

设计基于
Availability优先原则
稳妥采用双上联CLOS架构

Podset设计是综合考虑
存储容量和硬件成本的产物
它同时可以有效限定RDMA故障域

通过对TCP流程的优化
盘古克服了另一个痛点
就是RDMA/TCP的混传问题

知易行难
支持RDMA的RNIC好选
但引入新的硬件平台需要大量测试
阿里在25G网卡的评估入网花费2年时间

另外
即使微软等踩过坑
盘古在PFC风暴抑制仍有大量工作

所以只有自己
踩过坑才是经验
盘古有ACM金牌选手加持
其实开源Ceph也可考虑网卡



