近日英伟达专供中国的AI芯片H20已经受到进口管制,非常时期特殊环境下,如何保证AI算力,不使大模型被“卡脖子”成为广大从业者都要面临的严峻形势。如何在缺少高性能AI芯片的情况下,获得高速运算表现,是一个亟待解决的问题。
Infortrend推出的企业云平台(IEC),将计算、存储和 Kubernetes 管理集成为一体。单台可以最多安装4张GPU卡。IEC的计算节点KS可以横向扩展最多20个节点,这就意味着IEC可以扩展安装80张GPU卡。Infortrend能够将这80张GPU卡进行“池化”,即整合成一个虚拟的大GPU池,组成GPU集群,实现并行处理数据。
这样就能跨节点调用GPU资源,极大地释放GPU效能。特别是在高阶AI 芯片受到限制的当下,可以将80张搭载低阶AI芯片的GPU卡整合在一起,叠加性能为AI模型提供足够的算力,不失为一个纾解“卡脖子”的有效方法,考虑到低阶GPU卡的价格,用户也能把成本控制在合理的范围内。
同样的方法也适用于CPU,KS集群能够扩展到高达1280核的算力,供AI模型跨节点调用,特别适合语言类AI模型的推理。GPU、CPU资源共享通过Infortrend自研的管理界面EonKube实现。图形化的界面让用户直观的调取各节点GPU/CPU资源,合理管控GPU/CPU的使用情况,降低用户部署运行AI模型的技术门槛。
除了GPU共享功能之外,IEC还具有GPU直通功能,让多台VM虚拟机直接调取GPU资源。无论共享还是直通,都可以EonKube管理界面上完成。EonKube的图形化界面,提供直观的管理接口,让用户不需要经过特别培训,就可以进行GPU共享、自动扩展、VM管理、资源管理等各种操作,实现对GPU/CPU/VM完全掌控。
EonKube还提供专有的应用管理界面。内置应用市场提供制造业、大数据、IT服务、AI/机器学习等10多个类别的应用。通过EonKube可一键下载容器化应用,还能根据需要创建定制化应用image在本地安装。制造业利用EonKube能够简单快捷地在本地搭建专属计算中心,推动企业级应用,如AOI、MES智能化升级,帮助企业迈向工业4.0。
扩展阅读

