大数跨境
0
0

技术速递|Windows ML 正式发布:助力开发者在 Windows 设备上大规模扩展本地 AI

技术速递|Windows ML 正式发布:助力开发者在 Windows 设备上大规模扩展本地 AI 微软开发者MSDN
2025-11-17
0

M

点击蓝字 / 微软开发者MSDN

关注我们


作者:Logan Iyer

排版:Alan Wang



人工智能的未来是混合型的:充分利用云端与客户端各自的优势,同时发挥每一台 Windows 设备的潜力,实现更多可能。在微软,我们正在重新构想可能性——将强大的 AI 计算能力直接引入 Windows 设备,开启一个「在你所在之处运行」的新智能时代。借助硅技术的突破、现代化的软件架构和深度的操作系统集成,Windows 11 正在转变为世界上最开放、能力最强的本地 AI 平台。


今天我们很高兴地宣布:Windows ML 现已正式进入生产环境使用,可供开发者在不断演进的 AI 生态中部署生产级体验。Windows ML 于 Build 2025 首次亮相,是内建的 AI 推理运行时,经过针对设备本地模型推理进行了优化,并简化了跨 CPU、GPU 和 NPU 的模型依赖管理。它是 Windows AI Foundry 的基础,并被 Foundry Local 用于扩展芯片支持,该功能今天正式发布。


通过充分利用我们活跃的芯片合作伙伴生态中的 CPU、GPU 和 NPU,并基于 ONNX 的强劲势头,Windows ML 使开发者能够在设备端高效、安全地运行实时 AI 工作负载。本地运行模型的能力,让开发者能够构建更快速响应、更具隐私保护且成本更低的 AI 体验,覆盖最广泛的 Windows 硬件。


于 Build 2025 首次亮相

https://blogs.windows.com/windowsdeveloper/2025/05/19/advancing-windows-for-ai-development-new-platform-capabilities-and-tools-introduced-at-build-2025/#:~:text=Windows%20ML%20is%20the%20foundation%20of%20our%20AI%20platform%20and%20the%20built%2Din%20AI%20inferencing%20runtime%20on%20Windows/?wt.mc_id=3reg_webpage_reactor

Windows AI Foundry

https://developer.microsoft.com/en-us/windows/ai/?wt.mc_id=3reg_webpage_reactor

Foundry Local

https://aka.ms/FL_refresh_devblog/?wt.mc_id=3reg_webpage_reactor

自有模型高效跨芯片部署 —— 在 Windows 上安全本地运行


Windows ML 与 ONNX Runtime(ORT)兼容,开发者可以继续使用熟悉的 ORT API,同时便于现有生产工作负载的平滑迁移。Windows 负责 ORT 及 Execution Providers(EPs)的分发和维护,减轻了应用开发者的负担。Execution Providers 作为核心运行时与强大多样的芯片生态之间的桥梁,使模型在 AMD、Intel、NVIDIA 和 Qualcomm 等不同芯片上的执行能够独立优化。以 ONNX 为模型格式,Windows ML 能与现有模型和工作流无缝集成。开发者既可以直接使用已有的 ONNX 模型,也可以通过 VS Code 的 AI Toolkit 将源 PyTorch 模型进行转换和优化,并部署到 Windows 11 设备上。

Windows ML 堆栈示意图


当 AI 开发者使用各种模型时,Windows ML 充当硬件抽象层,提供多重优势:


  • 简化部署:我们的基础设施 API 允许开发者利用设备上可用的 Execution Providers 或动态下载的方式,支持多种硬件架构,而无需为每种架构单独构建应用。同时,开发者还可以选择提前编译(AOT)模型,为最终用户提供更流畅的体验。

  • 降低应用开销:Windows ML 会自动检测用户硬件并下载相应的 Execution Providers,无需在应用中打包运行时或 EP。这种精简方式在面向广泛设备时,可为开发者节省数十至数百兆的应用体积。

  • 兼容性:通过与芯片合作伙伴协作,Windows ML 致力于保持一致性与兼容性,支持持续更新,同时通过认证流程确保不同版本间模型的准确性。

  • 高级芯片优化:开发者可以为设备分配策略,以优化低功耗(NPU)、高性能(GPU),或指定模型使用的芯片类型。


想深入了解 Windows ML 的技术细节,请点击此处了解更多


点击此处了解更多

https://learn.microsoft.com/en-us/windows/ai/new-windows-ml/overview/?wt.mc_id=3reg_webpage_reactor

Windows ML 与芯片合作伙伴协作优化最新硬件


Windows 11 拥有多样化的硬件生态,包括 AMD、Intel、NVIDIA 和 Qualcomm,涵盖 CPU、GPU 和 NPU。消费者可以从多种 Windows PC 中选择,这种多样性为开发者创造创新的本地 AI 体验提供了可能。


我们与芯片合作伙伴紧密协作,确保 Windows ML 能充分利用他们最新的 CPU、GPU 和 NPU 来处理 AI 工作负载。具体做法是,芯片合作伙伴构建并维护执行提供程序(Execution Providers),而 Windows ML 负责分发、管理和注册这些 EP,使 AI 工作负载能够在设备上高效运行,同时为开发者提供硬件抽象层,并实现每种芯片的最佳性能。


AMD 已在其 Ryzen AI 平台上整合了 Windows ML 支持,使开发者能够通过 AMD 专用的 Vitis AI 执行提供程序,在 NPU、GPU 和 CPU 上充分利用 AMD 芯片的算力。了解更多

“通过在 Ryzen AI 平台上整合 Windows ML 支持,AMD 让开发者更轻松地发挥 CPU、GPU 和 NPU 的联合性能。与微软合作,我们正在打造可扩展、高效且高性能的 AI 体验,能够在 Windows 生态中无缝运行。”

— John Rayfield,AMD 计算与图形集团企业副总裁

Intel 的 Execution Provider 将 OpenVINO AI 软件的性能与效率与 Windows ML 相结合,使 AI 开发者能够轻松选择适合其工作负载的最佳 XPU(CPU、GPU 或 NPU),运行在 Intel Core Ultra 处理器的 PC 上。了解更多

“Intel 与微软在 Windows ML 上的合作,使开发者能够轻松部署自定义 AI 模型和应用,跨 CPU、GPU 和 NPU 在 Intel AI 支持的 PC 上运行。借助 OpenVINO 框架,Windows ML 加速了前沿 AI 应用的交付,实现更快的创新和卓越效率,充分释放 Intel Core Ultra 处理器的潜力。”

— Sudhir Tonse Udupa,Intel AI PC 软件工程副总裁 

NVIDIA 的 TensorRT for RTX EP 允许 AI 模型在 NVIDIA GeForce RTX 和 RTX PRO GPU 上运行,利用 NVIDIA 专用的 Tensor Core 库实现最高性能。该轻量级 EP 为系统的特定 RTX GPU 生成优化的推理引擎(运行 AI 模型的指令)。了解更多

“结合 TensorRT for RTX 的 Windows ML 在 NVIDIA RTX GPU 上的推理速度比 DirectML 提升超过 50%,且易于部署,使开发者能够在超过 1 亿台 Windows 设备上扩展生成式 AI。速度与覆盖范围兼具,让开发者为 Windows 用户创造更丰富的 AI 体验。”

— Jason Paul,NVIDIA 消费者 AI 副总裁 

Qualcomm 与微软合作,利用 Qualcomm 神经网络 Execution Provider(QNN EP)以及通过 ONNX Runtime EP 集成的 GPU 和 CPU,优化 Windows ML AI 模型和应用在 Snapdragon X 系列 NPU 上的运行。了解更多

“随着 Windows ML 上线以及 Foundry Local 预览,这对 Windows 上的 AI 开发者来说是一个关键时刻。新的 Windows ML 运行时不仅提供前沿的设备端推理,还简化了部署,使开发者能够充分利用 Snapdragon X 系列平台上的先进 AI 处理器。其统一框架及对 NPU、GPU 和 CPU 的支持确保了 Snapdragon Windows PC 上卓越的性能与效率。随着 Agentic AI 体验走向主流,我们与微软的深度合作正加速创新,为 Windows Copilot+ PC 以及即将推出的下一代 Snapdragon X2 平台带来最佳 AI 体验。”

— Upendra Kulkarni,Qualcomm 产品管理副总裁


了解更多 - AMD

https://nam06.safelinks.protection.outlook.com/?url=https%3A%2F%2Fwww.amd.com%2Fen%2Fblogs%2F2025%2Fempowering-ai-pcs-with-amd-and-windowsml.html&data=05%7C02%7Cdianakattan%40microsoft.com%7Cf6956d94497e45d46b5008ddf6cd3db0%7C72f988bf86f141af91ab2d7cd011db47%7C1%7C0%7C638938084062559168%7CUnknown%7CTWFpbGZsb3d8eyJFbXB0eU1hcGkiOnRydWUsIlYiOiIwLjAuMDAwMCIsIlAiOiJXaW4zMiIsIkFOIjoiTWFpbCIsIldUIjoyfQ%3D%3D%7C0%7C%7C%7C&sdata=xXnvGim7sqXpWwzRntIs7gLChdSBtaCN0USDaisFjlg%3D&reserved=0/?wt.mc_id=3reg_webpage_reactor

了解更多 - Intel

https://nam06.safelinks.protection.outlook.com/?url=https%3A%2F%2Fwww.intel.com%2Fcontent%2Fwww%2Fus%2Fen%2Fdeveloper%2Farticles%2Fcommunity%2Faccelerating-ai-pc-experiences-openvino-windows-ml.html&data=05%7C02%7Cjoel.liefke%40microsoft.com%7C6bc8d5a158ec4f39605b08ddf7060959%7C72f988bf86f141af91ab2d7cd011db47%7C1%7C0%7C638938327523955584%7CUnknown%7CTWFpbGZsb3d8eyJFbXB0eU1hcGkiOnRydWUsIlYiOiIwLjAuMDAwMCIsIlAiOiJXaW4zMiIsIkFOIjoiTWFpbCIsIldUIjoyfQ%3D%3D%7C0%7C%7C%7C&sdata=vR%2Bbi6mCwC6RQkZXw0eV2CbOIG3jY6OHoiyxSb4dOO0%3D&reserved=0/?wt.mc_id=3reg_webpage_reactor

了解更多 - NVIDIA

https://developer.nvidia.com/blog/deploy-ai-models-faster-with-windows-ml-on-rtx-pcs/?wt.mc_id=3reg_webpage_reactor

了解更多 - Qualcomm

https://www.qualcomm.com/developer/blog/2025/09/accelerate-ai-apps-windowsml-on-snapdragon-x-elite-devices/?wt.mc_id=3reg_webpage_reactor

在 Windows 软件生态中实现本地 AI



在开发 Windows ML 时,我们优先考虑了开发 AI 功能应用的开发者反馈。在公开预览期间,我们曾与应用开发者合作,测试 Windows ML 的集成情况。


领先的软件开发商,如 AdobeBUFFERZONEDot Inc.McAfeeReincubateTopaz Labs 和 Wondershare 等,正在计划在即将发布的版本中采用 Windows ML,加速本地 AI 能力在各类应用中的普及。通过利用 Windows ML,我们的软件合作伙伴可以专注于构建独特的 AI 功能,而无需担心硬件差异。他们的早期采用和反馈显示出本地 AI 的强劲发展势头,推动更快速的开发,并在多种使用场景中开启新的本地 AI 体验:


  • Adobe Premiere Pro 与 Adobe After Effects:加速媒体库内容的语义搜索、按类型标记音频片段、检测场景切换,均在即将发布的版本中由本地 NPU 提供支持;计划逐步将现有设备端模型的完整库迁移至 Windows ML。

  • BUFFERZONE:实现实时安全网页分析,在不将敏感数据发送到云端的情况下保护用户免受网络钓鱼和诈骗攻击。

  • Camo by Reincubate:利用实时图像分割和其他 ML 技术,在流媒体和演示中提升网络摄像头视频质量,同时在所有芯片平台上使用 NPU。

  • Dot Vista by Dot Inc.:支持免提语音控制和光学字符识别(OCR)以满足无障碍需求,包括在医疗环境中使用 Copilot+ PC 的 NPU 部署。

  • Filmora by Wondershare:使用针对 AMD、Intel 和 Qualcomm 平台 NPU 加速优化的 AI 驱动人体特效,包括实时预览与应用诸如 Lightning Twined、Neon Ring、Particle Surround 等人体特效。

  • McAfee:自动检测深度伪造视频及社交网络中可能出现的其他诈骗手段。

  • Topaz Photo by Topaz Labs:专业级图像增强应用,帮助摄影师锐化细节、恢复对焦、调整每张照片的色阶——全部由 AI 驱动。 


Adobe

https://apps.microsoft.com/detail/XPDLPKWG9SW2WD?hl=en-US&gl=US&ocid=pdpshare/?wt.mc_id=3reg_webpage_reactor

BUFFERZONE

https://bufferzonesecurity.com/

Dot Inc.

https://www.dotincorp.com/en/service/ai

McAfee

https://www.mcafee.com/ai/scam-detector

Reincubate

https://apps.microsoft.com/detail/9PGM3QB3PDRD?hl=en-us&gl=US&ocid=pdpshare/?wt.mc_id=3reg_webpage_reactor

Topaz Labs

https://www.topazlabs.com/

Wondershare

https://filmora.wondershare.net/brand.html?msclkid=1f3eacdcfdf113ceba4ac40d73213544&utm_source=bing&utm_medium=cpc&utm_campaign=Filmora_Brand_SS_All1_US%2FUK%2FCA%2FAU_EN_Pid(1901)_Bing-PC&utm_term=filmora&utm_content=1.%20Brand-Filmora%20skag

简化的 Windows ML 工具链


开发者可以通过一套强大的工具轻松使用 Windows ML,实现模型部署简化。VS Code for AI Toolkit 提供了用于模型和应用准备的强大工具,包括从 PyTorch 的 ONNX 转换、量化、优化、编译和评估——全部集中在一个平台上。这些功能让开发者更容易准备和部署高效模型,免去了多次构建和复杂逻辑的麻烦。从今天起,开发者还可以在 AI Dev Gallery 中使用 Windows ML 尝试自定义 AI 模型,该平台提供交互式工作空间,使开发者能够更轻松地发现和实验基于本地模型的 AI 场景。


AI Dev Gallery

http://aka.ms/ai-dev-gallery/?wt.mc_id=3reg_webpage_reactor

立即开始


随着 Windows ML 正式进入生产环境,Windows 11 提供了可用于生产应用的本地 AI 推理框架。Windows ML 已包含在 Windows App SDK 中(从 1.8.1 版本开始),支持所有运行 Windows 11 24H2 或更高版本的设备。


要开始使用 Windows ML 开发:

  1. 将项目更新至最新的 Windows App SDK

  2. 调用 Windows ML API 初始化执行提供程序(EP),然后加载任意 ONNX 模型,并仅用几行代码即可开始推理。有关详细教程、API 参考和示例代码,请访问 ms/TryWinML

  3. 若想体验 Windows ML 自定义 AI 模型的互动示例,可访问 AI Dev Gallery:ms/ai-dev-gallery


Windows App SDK

https://learn.microsoft.com/en-us/windows/apps/windows-app-sdk/stable-channel#version-171-17250401001/?wt.mc_id=3reg_webpage_reactor

ms/TryWinML

https://ms/TryWinML/?wt.mc_id=3reg_webpage_reactor

ms/ai-dev-gallery

https://ms/ai-dev-gallery/?wt.mc_id=3reg_webpage_reactor

使用 Windows ML 开发本地 AI 解决方案


Windows 开发一直致力于帮助开发者充分发挥软件和硬件的潜力。Windows ML 让新手和经验丰富的开发者都能轻松构建 AI 驱动的应用,专注于创新并减少应用体积。我们在微软非常期待看到大家在 Windows 11 PC 上使用 Windows ML 创造出的全新体验。智能化、AI 增强的 Windows 应用时代已经到来——并向每一位开发者开放。让我们携手借助 Windows ML,引领这波创新浪潮!


微信公众号|微软开发者MSDN

新浪微博|微软中国MSDN

·END·

【声明】内容源于网络
0
0
微软开发者MSDN
微软云Azure技术生态官方公众平台
内容 2706
粉丝 0
微软开发者MSDN 微软云Azure技术生态官方公众平台
总阅读2.3k
粉丝0
内容2.7k