头图

在计算机视觉领域,YOLO (You Only Look Once) 系列模型凭借其高效的实时目标检测能力,长期占据主导地位,广泛应用于自动驾驶、视频监控和机器人视觉等场景。尽管 YOLO 系列模型不断迭代优化,却依然面临精度与速度的权衡难题,传统的卷积神经网络 (CNN) 架构的局限性愈发明显,制约了模型性能的进一步提升。

近日,纽约州立大学布法罗分校联合中国科学院大学发布的 YOLOv12 版本,在继承模型以往版本高效特性的同时,引入了区域注意力机制 (area-attention) 和残差高效层聚合网络 (R-ELAN),极大降低了计算复杂度,显著提升了运行速率,还有效解决了注意力机制衍生的优化难题。与之前版本相比,YOLOv12 以更少的参数实现了更高的精度,在速度和精度之间实现了更好的平衡,成功突破了传统 CNN 架构的性能瓶颈。

目前,OpenBayes 公共教程板块已上线 YOLOv12 及 YOLO 系列模型多个版本的一键部署教程, 快来试试吧~

教程地址:

https://go.openbayes.com/FAPVZ

本文结尾部分将为大家讲解 YOLOv12 一键部署教程。

1、YOLOv2

发布时间: 2017 年

重要更新:提出了 Anchor Boxes(锚框),采用 Darknet-19 作为骨干网络,提高了速度和精度。

用 TVM 在 DarkNet 模型中编译 YOLO-V2:

https://go.openbayes.com/W20j8

2、YOLOv3

发布时间: 2018 年

重要更新: 使用 Darknet-53 作为骨干网络,在保持实时速度的同时显著提高了准确性,提出了多尺度预测(FPN 结构),在检测不同大小的目标和处理复杂图像方面取得了显著改进。

用 TVM 在 DarkNet 模型中编译 YOLO-V3:

https://go.openbayes.com/W20j8

3、YOLOv4

发布时间: 2020 年

重要更新: 采用了 CSPDarknet53,提高了推理速度和准确性。在 COCO 数据集上大幅提高 mAP,小目标检测更佳,训练泛化强且收敛更快。

一键部署:

https://go.openbayes.com/od2Kk

4、YOLOv5

发布时间: 2020 年

重要更新: 引入自动锚框调整机制,保持了实时检测能力,提高了准确性。采用更轻量化的 PyTorch 实现,使其更易于训练和部署。

一键部署:

https://go.openbayes.com/UIJe9

5、YOLOv4

发布时间: 2024 年 5 月

重要更新: 消除了非最大抑制 (NMS) 要求,减少推理延迟。纳入大核卷积和部分自注意模块,在不增加大量计算成本的情况下提高性能。全面优化了各种组件,提高了效率和准确性。

一键部署:

https://go.openbayes.com/6CtW9

6、YOLOv11

发布时间: 2024 年 9 月

重要更新: 在多项任务(包括检测、分割、姿态估计、跟踪和分类)中提供最先进的 (SOTA) 性能,利用了各种 AI 应用程序和领域的功能。

一键部署:

https://go.openbayes.com/silw7

7、YOLOv12

发布时间: 2025 年 2 月

重要更新: 引入了区域注意力机制 (area-attention) 和残差高效层聚合网络 (R-ELAN),极大降低了计算复杂度,显著提升了运行速率。

一键部署:

https://go.hyper.ai/Nztnq

YOLOv12 一键部署教程

OpenBayes 公共教程板块现已上线「一键部署 YOLOv12」,该教程已经为大家搭建好了环境,无需输入任何命令,点击克隆即可快速体验 YOLOv12 的强大功能!

教程地址:

https://go.openbayes.com/FAPVZ

01 运行步骤

  1. 登录 http://OpenBayes.com,在「公共教程」页面,选择「 一键部署 YOLOv12 」。

  1. 页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。

  1. 选择「NVIDIA RTX 4090」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。新用户使用下方邀请链接注册,可获得 4 小时 RTX 4090 + 5 小时 CPU 的免费时长!

小贝总专属邀请链接(直接复制到浏览器打开):

https://go.openbayes.com/9S6Dr

  1. 等待分配资源,首次克隆需等待 2 分钟左右的时间。当状态变为「运行中」后,点击「API 地址」旁边的跳转箭头,即可跳转至 Demo 页面。请注意,用户需在实名认证后才能使用 API 地址访问功能。

02 效果展示

该教程包含图像检测和视频检测 2 个功能。

图像检测

选择「Image」板块,上传图片并调整参数后,点击「Detect Object」,YOLOv12 精准且高效地完成实时检测任务,无论是较大的人物目标,还是细微如领带的物体,均能被精准识别。

参数如下:

  • 模型 Model: yolo12s.pt
  • 图片尺寸 Image Siza: 640
  • 置信度阈值 Confidence Threshold: 0.25

视频检测

选择「Video」板块,上传视频,点击「Detect Object」,可以看到 YOLOv12 对视频的实时检测任务也完成得非常出色。

新用户福利

注册福利: 点击下方邀请链接注册,即可获得 4 小时 RTX 4090 + 5 小时 CPU 的免费算力时长,永久有效!

小贝总专属邀请链接(直接复制到浏览器打开):

https://go.openbayes.com/9S6Dr


OpenBayes
6 声望1 粉丝

贝式计算是中国领先的高性能计算服务提供商,通过为新一代异构芯片嫁接经典软件生态及机器学习模型,向工业企业及高效科研院所提供更加快速、易用的数据科学计算产品。