▼ 关注大联大公众号,了解行业动态等更多资讯!
MLPerf v5.1基准测试显示Intel Xeon 6与Arc Pro B系列显卡能为工作站与边缘设备提供强大、低延迟的AI推理能力。
MLCommons 发布最新MLPerf Inference v5.1基准测试结果,展示了搭载P-core的Intel® Xeon®处理器与Intel® Arc™ Pro B60显卡的Intel GPU系统(代号项目战斗矩阵)在六项关键基准测试的成果。在Llama 8B测试中,Intel Arc Pro B60的每元性能相较于NVIDIA RTX Pro 6000为1.25倍、比起L40S更高达4倍。这些结果凸显了全英特尔平台在高端工作站与边缘应用中,针对新兴AI推理工作负载所展现的性能与可及性。
英特尔公司副总裁兼软件、GPU与NPU IP部门总经理Lisa Pearce表示:“MLPerf v5.1的结果有力地验证了英特尔的GPU与AI策略。Arc Pro B系列的显卡搭配针对推理优化的软件堆栈,让开发者与企业能够通过推理工作站更快速地开发与部署AI应用。这些工作站性能强大、设置简单、价格合理且具备可扩展性。”
重要意义:专业用户在寻找高推理性能平台时,往往选择有限,必须在数据隐私与专有AI模型的高订阅成本之间做出取舍,同时还需具备部署大型语言模型(LLM)的能力。
这些新的Intel GPU系统(代号Project Battlematrix)正是针对现代AI推理需求而设计,提供结合完整硬件与软件堆栈的全方位推理平台。
Intel GPU系统引入了针对Linux环境设计的新容器化解决方案,进一步简化了采用过程并提升了使用体验。除了可以通过多GPU扩展和PCIe P2P数据传输优化推理性能外,同时还具备企业级的可靠性和可管理性,包括ECC、SR-IOV、遥测和远程固件更新等功能。
CPU在AI系统中持续扮演关键角色。作为协调中枢,CPU负责前处理、传输与整体系统协调。过去四年,英特尔持续强化CPU的AI性能,使Intel Xeon成为GPU驱动系统中承载与管理AI工作负载的首选CPU。
英特尔也是唯一向MLPerf提交CPU服务器测试结果的厂商,展现其领导地位以及在计算与加速架构上推动AI推理能力的深度承诺。值得强调的是,搭载P-core的Intel Xeon 6在MLPerf Inference v5.1中,相较于前一代展现了1.9倍的性能提升。
✻ 本文图片来源:英特尔
点击阅读原文,了解更多详情!
点赞
收藏
分享

