随着AI技术的快速发展,特别是DeepSeek在今年年初引爆的新一轮AI浪潮,也标志着中国企业的数智化转型真正进入了AIDC时代。AI技术虽然快速发展,但AI与千行万业如何真正的融合才是新时代企业发展的关键。近日,华瑞指数云ExponTech发布的AI原生智能数据平台 WADP,其核心理念是“One Platform, All Workloads”(一个平台承载全部应用)。将企业核心生产系统(如关键数据库)与AI数据管道(包括训练、推理、向量检索等)统一承载于同一平台,通过这种统一性实现了对传统存储阵列、文件系统及大数据存储的现代化融合替代,为企业构建面向未来的AI数据基础设施。凭借其统一架构和AI原生的特性,能够全面覆盖两大核心应用领域:通用企业存储场景和AI Infra存储场景。

WADP通过WDS(块存储)和WFS(文件存储)的协同,为企业提供强大的通用存储能力,满足传统核心业务的严苛需求 。WADP的“共池能力”允许WDS和WFS共享融合存储资源池,数据可在高性能全闪池和中低性能混闪池之间动态跨池流动,满足关键业务的弹性性能增长需求 。
WADP通用存储能力概览
WADP在AI场景中的能力是其作为AI Infra产品的核心体现,通过WDS、WFS、WOS(在研)和WQS的协同,实现了对AI全栈数据存储需求的覆盖 。WADP可以主要覆盖三大AI场景:
场景一:实现AI全流程高效数据存储,优化训练推理
WADP致力于实现AI全流程的高效数据存储,从而优化AI模型的训练和推理效率 。
统一数据平台底座: WADP提供统一数据平台底座,覆盖AI数据全生命周期,包括“生产数据存储、数据预处理、AI数据训练、Checkpoint写入、模型分发、AI推理、RAG/MCP对接外部数据源全流程” 。这意味着数据不再需要在不同存储系统间拷贝,保证数据实时性、一致性和高效共享访问 。
加速AI训练与模型加载:
-
共享存储卷:基于高性能块存储WDS的共享存储卷,完成训练数据库与AI模型的高速分发与读取。
-
极致性能:提供最佳的随机读取性能,最高效的IOPS(单客户端数百万),最低的时延(微秒级)和超大带宽(单客户端数十GB/s)。一个共享存储卷最多支持上千客户端并行读取,提供高达500GB/s的总读带宽。
-
模型秒级加载:WADP支持高性能快照克隆卷,实现AI模型“秒级加载”。
-
版本管理:基于存储的无损快照能力,实现对训练数据集的高效版本管理。
高效Checkpoint写入与数据协作: 基于分布式文件系统的共享目录,高效完成数据协作和共享写入 。有效实现大带宽,无需安装专属客户端,使用和运维简便,特别适合AI训练中的Checkpoint(检查点)写入。
云原生CSI对接: WADP支持云原生CSI(容器存储接口)对接训推调度平台,实现与主流AI框架和调度系统无缝集成。

WADP通过对AI全流程的统一管理和性能优化,显著提升GPU集群利用率,减少GPU等待存储时间,加速AI模型开发和部署。
场景二:L2/L3 SSD KVCache(WQS)革命性优化推理效率与成本
WQS(WiDE Query Storage)是WADP在AI推理领域的核心创新,通过构建“革命性的全局KV Cache层”,显著优化推理效率并大幅降低成本 。
KVCache分层与卸载:WADP通过WQS本身作为一个基于WiDE引擎的分层KVCache与数据服务层,实现原生KV接口与HBM(高带宽内存)或RAM(随机存取存储器)对接,形成L2/L3级KVCache。能将KVCache从昂贵的GPU显存和主机内存中卸载到成本更低的SSD上。这“显著降低GPU显存占用”,从而支持“多会话并发与长上下文推理”。
降低成本:通过卸载KVCache,“大幅降低推理场景的成本”,实现“60%推理GPU卡成本节省”。
提升推理速度与容量:WQS能将推理速度(TTFT,Time To First Token)提升“5x~8x”,甚至“接近完全采用HBM的速度”。提供“近似无限的可持久化的memory空间”用于KVCache及上下文数据 ,极大地延伸推理上下文存储,并显著降低L1/L2 KVCache需求。
极低时延与高吞吐:WADP全栈采用100GE/200GE RoCEv2或200GE/400GE InfiniBand网络互联,结合自研高性能软件栈,实现“us级时延”,提供“超高吞吐极低时延的推理体验”。
灵活部署模式:WADP可提供远端存储集群作为L2/L3 Remote SSD KVCache Pool,也可整合GPU Node本地SSD形成Hyper KVCache Pool。
广泛生态兼容性:WQS旨在成为通用分层KVCache解决方案,与vLLM、LightLLM、SGLang、Mooncake、Dynamo等多种主流推理框架“无缝兼容”。

WQS是WADP作为AI Infra产品公司的核心竞争力之一 。它直接解决了大模型推理规模化部署中的关键痛点——昂贵的GPU显存和有限的上下文长度 。通过创新KVCache分层技术,WQS不仅大幅降低推理成本,更提升推理效率和模型处理长上下文能力,加速大型AI模型的工业化应用 。
WQS KVCache价值亮点

场景三:一站式RAG全流程数据存储与性能提升
WADP在RAG(检索增强生成)场景中发挥关键作用,提供“一站式RAG全流程数据存储与性能提升”的能力。
统一数据承载能力: WADP(结合WFS和WDS)能“部署承载所有结构化与非结构化数据应用”,解决“AI场景全部的数据存储需求”。
构建RAG所需数据存储: WADP能“构建非结构化存储、关系型数据库、向量数据库等”,从而“一站式实现RAG全流程的数据存储能力”。
WiDE引擎赋能RAG性能: 借助“WiDE引擎高性能能力”,WADP实现“整个RAG过程的高性能优化”。
Agent记忆体与企业数据结合:WADP的存力能赋能AI大模型和Agent的“长久记忆”,并使其能与企业数据深度结合。

WADP在RAG场景中的能力,使得企业能构建真正智能、上下文感知的AI应用 。通过统一管理和优化所有RAG所需数据,WADP消除传统方案中因数据分散和性能瓶颈导致的复杂性和效率低下 。
目前,华瑞指数云ExponTech WADP是全球唯一在面向企业核心业务的权威存储评测SPC-1与面向AI存储场景的MLPerf Storage评测中均取得顶级成绩的分布式存储软件,充分验证了以一款统一的分布式存储软件覆盖企业全场景需求以及新兴AI需求的技术可行性。
在2023年华瑞指数云凭借分布式块存储软件WDS 打破了SPC-1存储性能的世界纪录,引领行业进入了“性能自由”的时代,可以通过横向扩容存储节点,来实现高达亿级的IOPS。开启高端存储产品软件化、国产化的新纪元。 就在前不久,MLPerf Storage v2.0存储榜单中华瑞指数云的成绩依然表现卓越,进一步巩固了其在AI存储领域的领导地位 。充分展示了WADP在AI工作负载下的原始性能,更突出了其在资源效率、能效和可扩展性方面的领先优势 。

Resnet50模型训练:实现“单客户端支持的GPU卡数和带宽排世界第一”。
Llama3模型Checkpoint写入:写入带宽排名“世界第三”,但仅使用了其他评测方案1/5的SSD盘数 。如果以“Checkpoint写入带宽/存储容量”计算写入效率,华瑞指数云WADP方案“遥遥领先居第一”,展现了极为高效的硬件利用效率。
创新硬件集成与网络验证:WADP软件完全运行于英伟达Bluefield-3 DPU内,硬件配置规格远低于其他方案 。测试验证了四台英伟达Spectrum-X交换机搭建的两层RoCE网络,拥塞控制表现优异,可扩展到1024存储节点的超大规模AI集群。
华瑞指数云始终坚持全栈自研,不依赖国外开源“捷径”。WADP通过“全软件化、分布式化、云化与智能化”,为AI、高性能分析、核心数据库等场景提供极高性能、超低时延、稳定可靠的统一存储与管理能力,彻底解决了数据在AI全流程中的流通与管理难题。
媒体报道 | 36氪专访华瑞指数云:SDS进入2.0时代,渐进式迭代以10年为周期
“颠覆·挑战·极致”华瑞指数云ExponTech WDS新一代产品重新定义企业存储和数据架构

