大数跨境
0
0

「YOLO+1」的游戏循环被打破?最新YOLO26出炉,端到端架构重塑实时检测新范式

「YOLO+1」的游戏循环被打破?最新YOLO26出炉,端到端架构重塑实时检测新范式 极市平台
2025-09-26
1
导读:↑ 点击蓝字 关注极市平台作者丨小书童来源丨集智书童编辑丨极市平台极市导读 导读 >>加入极市CV技术交流群,
↑ 点击蓝字 关注极市平台
作者丨小书童
来源丨集智书童
编辑丨极市平台

极市导读

 

YOLO26 砍掉 DFL 和 NMS,原生端到端输出,配 MuSGD 优化器,CPU 推理提速 43%,小目标精度再跃升;一次训练搞定检测、分割、姿态等五大任务,为边缘设备带来“即下即用”的轻量级新基准。>>加入极市CV技术交流群,走在计算机视觉的最前沿

YOLO26 模型仍在开发中,尚未发布。此处显示的性能数据为预览。最终的下载和正式发布将很快跟进 — 请通过 YOLO Vision 2025 获取最新信息。

概述

Ultralytics 的 YOLO26 是 YOLO 系列实时目标检测器的最新演进,专为边缘和低功耗设备从头设计。它引入了一套简化的设计,去除不必要的复杂性,同时集成了有针对性的创新,以实现更快、更轻量、且更易于部署的模型。

YOLO26 的架构由三个核心原则驱动:

  • 简洁性: YOLO26 是一个原生端到端模型,直接输出预测结果,无需非极大值抑制(NMS)。通过消除这个后处理步骤,推理更快、更轻、更易于在实际系统中部署。这一端到端方法最早由清华大学的 Ao Wang 在 YOLOv10 中率先提出,并在 YOLO26 中得到进一步推进。
  • 部署效率: 端到端设计去掉了整段流水线,显著简化集成、降低延迟,并提升在多样环境下的部署鲁棒性。
  • 训练创新: YOLO26 引入了 MuSGD 优化器,它是 SGD 与 Muon 的混合体——灵感来自 Moonshot AI 在大模型训练上的 Kimi K2 突破。该优化器带来更稳定和更快的收敛,将语言模型的优化进展迁移到计算机视觉领域。

这些创新共同提供了一个在小目标上拥有更高精度、部署无缝且在 CPU 上最多提升 43% 推理速度的模型家族——使 YOLO26 成为资源受限环境下最实用、最易部署的 YOLO 模型之一。

Ultralytics YOLO26 Comparison Plots
Ultralytics YOLO26 Comparison Plots

01 主要特性

  • 移除 DFL
    分布焦点损失(DFL)模块虽然有效,但常常增加导出复杂度并限制硬件兼容性。YOLO26 完全移除了 DFL,简化了推理并扩大了对边缘和低功耗设备的支持。
  • 端到端无 NMS 推理
    与依赖 NMS 作为独立后处理步骤的传统检测器不同,YOLO26 是原生端到端的。预测直接生成,减少延迟,使得在生产系统中的集成更快、更轻、更可靠。
  • ProgLoss + STAL
    改进的损失函数提升检测精度,尤其在小目标识别方面有显著改进,这对物联网、机器人、航拍影像和其他边缘应用非常关键。
  • MuSGD 优化器
    一种将 SGD 与 Muon 相结合的新型混合优化器。灵感来自 Moonshot AI 的 Kimi K2,MuSGD 将大模型训练中的高级优化方法引入计算机视觉,带来更稳定的训练和更快的收敛。
  • CPU 推理速度提升最多达 43%
    YOLO26 针对边缘计算进行了专门优化,在无 GPU 的设备上也能提供近实时性能。

02 支持的任务与模式

YOLO26 被设计为一个多任务模型家族,扩展了 YOLO 在不同计算机视觉挑战中的适用性:

该统一框架确保 YOLO26 适用于实时检测、分割、分类、姿态估计和定向目标检测——在发布时均支持训练、验证、推理与导出。

03 性能指标

3.1 YOLO26 系列基准预览(早期版本)

注意:以下为训练完成前的早期预览数据。最终指标及可下载权重将在训练完成后发布。

目标检测(COCO)

训练数据:COCO(80 个预训练类别)
使用指南:模型发布后请参考 Detection Docs

注:YOLO26l 和 YOLO26x 的指标仍在评估中,最终结果将在此更新。

其他任务(指标即将发布)

3.2 与 YOLO11 相比,YOLO26 的主要改进是什么?

  • 移除 DFL:简化导出并扩大边缘兼容性
  • 端到端无 NMS 推理:取消 NMS 实现更快、更简单的部署
  • ProgLoss + STAL:提升精度,尤其是小目标
  • MuSGD 优化器:将 SGD 与 Muon(受 Moonshot 的 Kimi K2 启发)结合,带来更稳定、高效的训练
  • CPU 推理速度最多提升 43% :为仅 CPU 的设备带来重大性能提升

3.3 YOLO26 会支持哪些任务?

YOLO26 设计为一个统一的模型家族,发布时将对多种计算机视觉任务提供端到端支持:

  • 目标检测
  • 实例分割
  • 图像分类
  • 姿态估计
  • 定向目标检测 (OBB)

每个尺寸变体(n、s、m、l、x)计划在发布时支持所有任务。

3.4 为什么 YOLO26 针对边缘部署进行了优化?

YOLO26 在边缘设备上实现一流的性能,主要得益于:

  • 在 CPU 上推理速度提升最多 43%
  • 减小模型体积和内存占用
  • 架构简化以提高兼容性(无 DFL、无 NMS)
  • 支持灵活的导出格式,包括 TensorRT、ONNX、CoreML、TFLite 和 OpenVINO


公众号后台回复“数据集”获取100+深度学习各方向资源整理

极市干货

技术专栏:多模态大模型超详细解读专栏搞懂Tranformer系列大视觉模型 (LVM) 解读扩散模型系列极市直播
技术综述:小目标检测那点事大模型面试八股含答案万字长文!人体姿态估计(HPE)入门教程

点击阅读原文进入CV社区

收获更多技术干货


【声明】内容源于网络
0
0
极市平台
为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
内容 8155
粉丝 0
极市平台 为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
总阅读3.2k
粉丝0
内容8.2k