
活动中,曹羽中先生首先结合GTC展会现场见闻,剖析了全球存储产业与英伟达生态的深度绑定态势。他提到,本次GTC展会作为全球规模较大的AI领域盛会,存储厂商参与积极性高涨,同时专注于文件系统等领域的新兴存储企业也积极参与,彰显出存储产业与AI生态融合的强劲趋势。针对英伟达主导的产业生态,曹羽中先生重点解读了其CMX架构及相关技术布局。他表示,英伟达通过CMX架构与美国主流存储厂商开展大量前期联合开发,IBM等企业已基于该架构及英伟达新硬件完成多项研发工作并发布性能测试数据,形成了同步推进的良好态势。英伟达采用生态共建模式,并未直接涉足存储领域,而是联合众多厂商共同推动产业发展,对全球存储产业繁荣具有重要推动作用。华瑞指数云的AI原生KV Cache Storage产品WQS也在前期与英伟达的Bluefield DPU进行了适配开发和测试,实现了100%运行于Bluefield DPU内且能充分发挥出KV Cache分层加载所载的低延迟,超高带宽和全局共享读写的能力,能够承担英伟达CMX架构定义的G3.5层KV Cache(全局共享,大容量,原生KV接口,可与本地SSD接近的时延和性能)卸载的职能。
在技术细节层面,曹羽中先生深入解析了英伟达的硬件体系与架构创新。他介绍,英伟达正全力推广全局共享上下文存储,其核心硬件体系包括BlueField-4 DPU与Spectrum-x高速网络等,其中BlueField-4 DPU已作为英伟达新发布GPU的标配,具备800G带宽的强劲网络能力,可通过GDS通道与GPU实现直通,且针对相关网络体系进行了深度优化适配,搭配DOCA软件栈形成了完备的全链条技术体系。同时,本次GTC展会中,英伟达更鲜明地提出推理过程中分离式架构(PD分离)的必要性,通过收购LPU厂商Grok打造专属解码节点,明确未来Prefill节点与Decode节点将采用不同芯片针对性设计,而PD分离架构的普及,将使KV Cache的传输与管理变得尤为重要,CMX上下文存储体系有望成为AI算力集成的标配,推动KV Cache管理向全局共享模式转型。

结合国内产业实际,曹羽中先生分享了华瑞指数云的实践经验与思考。他表示,英伟达的参考架构基于自身硬件优势打造,国内企业无需盲目照搬,需结合国内市场环境、硬件可用性等实际情况,探索具有自身特色的AI存储方案。目前国内GPU、DPU产业仍面临诸多挑战,国产GPU缺乏完整生态支撑,处理能力与网络带宽与国际先进水平存在差距;国产DPU多基于网卡控制芯片研发,基础处理能力不足,难以满足高端场景需求。但他同时强调,英伟达STX与CMX架构的发布,为国内产业发展提供了重要风向标,明确了AI时代存储的价值定位与发展方向,国内厂商应沿着这一方向,结合自身优势寻找架构定位与产品实现路径,而非简单复制国外方案。
此次曹羽中先生的分享,不仅为现场嘉宾带来了GTC展会的前沿资讯与技术洞见,也为国内AI存储企业的发展提供了极具价值的参考思路。未来,华瑞指数云将持续聚焦AI存储领域的技术创新与实践,依托自身技术积累,探索符合国内市场需求的存储产品,助力国内存储产业高质量发展。

