Stratus：基于DeepSeek大模型的容错与性能优化- 大数跨境

Penguin Solutions

2025-02-21

2025年1月，幻方量化旗下深度求索公司发布DeepSeek R1大模型并开源，由于DeepSeek R1以极低的开发训练成本而实现了与GPT-4.0不相上下的性能，引发全球震动。DeepSeek R1以更低的成本、更高的效率颠覆了传统AI技术逻辑，直接挑战依靠高算力、高资本建立的人工智能发展模式，刺破了“算力即王道”的神话，其开源模式和算法创新，不仅打破了对高性能芯片的依赖，还重塑了全球AI生态的竞争规则。

饶毅说，DeepSeek是鸦片战争以来，中国对人类最大的科技震撼。马斯克说，DeepSeek是成本效率的革命性进步。对于广大企业和开发者而言，DeepSeek R1开源的最大意义在于降低了交流、学习和使用先进AI大模型的成本和门槛，为广大企业和开发者提供了入场的机会，更激发了行业创新活力，促使AI技术朝着多元化和普惠化的方向发展。

实际上，AI技术的每一次突破都在重新定义着人类社会的运作模式。

在DeepSeek出现之前，全球AI技术发展依靠不断堆积的算力进而形成高成本产业发展模式。如今DeepSeek通过开源和算法创新打破了对高性能芯片的依赖，大幅降低AI技术门槛，让更多企业与开发者加入的同时，也为产业智能化发展注入了全新活力。

Stratus ztC Endurance™平台

Stratus作为全球可用性解决方案领域的领先供应商，长期以来，通过与英特尔的深度合作，将平台构建在世界上最可靠的X86服务器上，通过独有的技术架构创新为客户提供高达99.99999%的高可用方案，保障企业关键业务和数据的不间断运行。Stratus最新发布的ztC Endurance™平台既能适用于SCADA、BCS、MES、BMS等场景需求，也能在数据中心核心业务领域支撑数据、网关、交易系统等应用需求。

近年随着AI技术的迅猛发展，企业对智能化应用场景的需求日趋迫切。以制造企业为例，为提高生产质量和效率，越来越多的工厂开始部署实施智能质检、设备预测性维护等工业智能化方案，这些场景依赖于对大量工业实时数据的采集，并基于AI模型进行实时推理分析。

基于这样一种需求，Stratus ztC Endurance也融入了AI推理功能，基于CPU进行AI图像分类，受益于平台的高吞吐量(每秒分析的图像数量)和低延迟(等待时间)，平台能高效地支撑起诸如智能质检、医疗影像分析等AI应用需求。

如今，随着DeepSeek R1的开源，Stratus公司内部正在基于DeepSeek大模型做内部开发测试，充分发挥CPU的计算资源，强化AI推理能力。

一直以来，在AI推理应用中，GPU比CPU有着先天优势，几乎所有的AI推理运算都是基于GPU或NPU等芯片来完成的，但DeepSeek的出现为我们提供了另外一种可能，即利用CPU同样能实现高效的AI应用推理。

在技术上，DeepSeek直接使用Nvidia的PTX进行底层硬件控制，绕过了部分CUDA层的限制，实现了对GPU资源的高效利用，同时支持在CPU上进行推理。特别是deepseek.cpp框架，它不依赖Python运行时，适用于低端CPU设备，代码体积较小，适合在资源有限的设备上运行‌。此外，DeepSeek的算法优化和模型架构设计也使其在CPU上表现出色。DeepSeek在多头潜在注意力机制和混合专家架构技术上取得了重大突破，使得模型在处理长序列数据时能够更加精准地聚焦于关键信息，减少了不必要的计算开销，提升了运行效率。‌这些技术优势使得DeepSeek在各种硬件平台上都能提供稳定的、生产级的服务能力，满足不同场景的需求。‌

Strutas技术专家表示，未来Stratus进一步优化提升现有平台的AI推理能力，进一步降低AI应用成本，不断深化客户的AI应用需求，通过进一步强化平台的AI推理能力和场景服务范围，帮助企业提升效率、降低成本，在智能化时代强化企业的竞争力。

Stratus 容错技术

【声明】内容源于网络

Penguin Solutions

Penguin Solutions致力于提供高性能和高可用性的计算基础设施解决方案和服务，以支持从边缘到核心再到云的关键工作负载的部署和运行——特别是在人工智能（AI）、高性能计算（HPC）、容错（FT）和边缘计算基础设施方面。

内容 481

粉丝 0

Penguin Solutions Penguin Solutions致力于提供高性能和高可用性的计算基础设施解决方案和服务，以支持从边缘到核心再到云的关键工作负载的部署和运行——特别是在人工智能（AI）、高性能计算（HPC）、容错（FT）和边缘计算基础设施方面。

总阅读815

粉丝0

内容481