2025年1月,幻方量化旗下深度求索公司发布DeepSeek R1大模型并开源,由于DeepSeek R1以极低的开发训练成本而实现了与GPT-4.0不相上下的性能,引发全球震动。DeepSeek R1以更低的成本、更高的效率颠覆了传统AI技术逻辑,直接挑战依靠高算力、高资本建立的人工智能发展模式,刺破了“算力即王道”的神话,其开源模式和算法创新,不仅打破了对高性能芯片的依赖,还重塑了全球AI生态的竞争规则。
饶毅说,DeepSeek是鸦片战争以来,中国对人类最大的科技震撼。马斯克说,DeepSeek是成本效率的革命性进步。对于广大企业和开发者而言,DeepSeek R1开源的最大意义在于降低了交流、学习和使用先进AI大模型的成本和门槛,为广大企业和开发者提供了入场的机会,更激发了行业创新活力,促使AI技术朝着多元化和普惠化的方向发展。
实际上,AI技术的每一次突破都在重新定义着人类社会的运作模式。
在DeepSeek出现之前,全球AI技术发展依靠不断堆积的算力进而形成高成本产业发展模式。如今DeepSeek通过开源和算法创新打破了对高性能芯片的依赖,大幅降低AI技术门槛,让更多企业与开发者加入的同时,也为产业智能化发展注入了全新活力。
Stratus ztC Endurance™平台
Stratus作为全球可用性解决方案领域的领先供应商,长期以来,通过与英特尔的深度合作,将平台构建在世界上最可靠的X86服务器上,通过独有的技术架构创新为客户提供高达99.99999%的高可用方案,保障企业关键业务和数据的不间断运行。Stratus最新发布的ztC Endurance™平台既能适用于SCADA、BCS、MES、BMS等场景需求,也能在数据中心核心业务领域支撑数据、网关、交易系统等应用需求。
近年随着AI技术的迅猛发展,企业对智能化应用场景的需求日趋迫切。以制造企业为例,为提高生产质量和效率,越来越多的工厂开始部署实施智能质检、设备预测性维护等工业智能化方案,这些场景依赖于对大量工业实时数据的采集,并基于AI模型进行实时推理分析。
基于这样一种需求,Stratus ztC Endurance也融入了AI推理功能,基于CPU进行AI图像分类,受益于平台的高吞吐量(每秒分析的图像数量)和低延迟(等待时间),平台能高效地支撑起诸如智能质检、医疗影像分析等AI应用需求。
如今,随着DeepSeek R1的开源,Stratus公司内部正在基于DeepSeek大模型做内部开发测试,充分发挥CPU的计算资源,强化AI推理能力。
一直以来,在AI推理应用中,GPU比CPU有着先天优势,几乎所有的AI推理运算都是基于GPU或NPU等芯片来完成的,但DeepSeek的出现为我们提供了另外一种可能,即利用CPU同样能实现高效的AI应用推理。
在技术上,DeepSeek直接使用Nvidia的PTX进行底层硬件控制,绕过了部分CUDA层的限制,实现了对GPU资源的高效利用,同时支持在CPU上进行推理。特别是deepseek.cpp框架,它不依赖Python运行时,适用于低端CPU设备,代码体积较小,适合在资源有限的设备上运行。此外,DeepSeek的算法优化和模型架构设计也使其在CPU上表现出色。DeepSeek在多头潜在注意力机制和混合专家架构技术上取得了重大突破,使得模型在处理长序列数据时能够更加精准地聚焦于关键信息,减少了不必要的计算开销,提升了运行效率。这些技术优势使得DeepSeek在各种硬件平台上都能提供稳定的、生产级的服务能力,满足不同场景的需求。
Strutas技术专家表示,未来Stratus进一步优化提升现有平台的AI推理能力,进一步降低AI应用成本,不断深化客户的AI应用需求,通过进一步强化平台的AI推理能力和场景服务范围,帮助企业提升效率、降低成本,在智能化时代强化企业的竞争力。