原文作者:AMD AI Group、Nexa AI
AMD 通过战略性合作,不断拓展设备端 AI 加速能力的极限,为开发者和研究人员开辟全新的可能性。今天,我们很高兴地介绍与 Nexa AI 的最新合作成果:在 AMD 神经处理单元(NPU)上实现 SDXL-Turbo 图像生成,并通过 NexaML 引擎 在 AMD 集成 GPU(iGPU)上运行 Gemma-3n 多模态推理。
此次战略合作的核心伙伴之一正是专注于设备端 AI 的 Nexa AI。Nexa AI 是一家聚焦设备端(on-device)AI 部署与研究的公司,致力于让设备端 AI 部署更加简便,并能直接应用于生产环境。在 2025 年 PyTorch 大会上,AMD 与 Nexa AI 的联合工程成果得到了重点展示,充分体现了双方在设备端 AI 优化领域的深厚技术实力。
SDXL-Turbo:基于 AMD NPU 的实时图像生成
SDXL-Turbo 是文本生成图像(text-to-image)技术的一项重要突破。作为 Stable Diffusion XL(SDXL)1.0 的高级蒸馏版本(即通过模型压缩与优化获得的轻量化版本),SDXL-Turbo 针对实时生成流程进行了深入优化。得益于 AMD 与 Nexa AI 的联合优化,该模型现已能够充分发挥 AMD NPU 的算力,实现高质量、低延迟的图像生成。
使用 NexaSDK 在 AMD NPU 上运行 SDXL-Turbo,只需两个简单步骤:
1.从Nexa SDK 模型中心 [1] 下载 Nexa SDK。
2.打开命令行,输入以下指令即可生成图像:
nexa infer NexaAI/sdxl-turbo-amd-npu --prompt "a cartoon cat"
模型加载至内存后即可开始图像生成,整个过程完全在设备端执行,无需依赖任何云端服务,并由 AMD Ryzen AI NPU 提供硬件加速支持。
NexaSDK:让开发者更轻松地构建设备端
NexaSDK 提供多项对开发者友好的实用功能,帮助用户更高效地构建设备端 AI 应用。该 SDK 支持 Python 绑定,可轻松集成到现有应用中;同时提供服务器模式,通过与 OpenAI API 兼容的接口,开发者可快速完成原型验证与功能测试。
详细信息可参阅 Nexa AI 官方文档:
Windows x86_64 的 Python 绑定文档 [2]
NexaSDK 服务器模式说明 [3]
总结
Try:在Nexa SDK 模型中心体验 NexaAI SDK [1]
Star:前往NexaAI 的 GitHub 页面为项目点亮 Star [4]
Subscribe:订阅AMD 开发者简讯,获取最新 Ryzen AI 开发动态 [5]
参考链接
[1] Nexa SDK 模型中心:https://sdk.nexa.ai/model/SDXL-turbo
[2] NexaSDK Python 绑定文档(Windows x86_64):https://docs.nexa.ai/nexa-sdk-go/quickstart#windows-x86_64
[3] NexaSDK 服务器模式说明:https://docs.nexa.ai/nexa-sdk-go/NexaAPI
[4] NexaAI GitHub 页面:https://github.com/NexaAI/nexa-sdk
[5] AMD 开发者新闻订阅:https://www.amd.com/en/forms/sign-up/developer-news.html?temp_comments=Ryzen%20AI%20Software

