YOWOv2：优秀的实时视频动作检测框架

出品人：Towhee 技术团队顾梦佳

为时空动作检测任务设计实时框架仍然是一个挑战。YOWOv2 提出了一种新颖的实时动作检测框架，利用三维骨干和二维骨干进行准确的动作检测。经过改进，YOWOv2 明显优于Y OWO，并且仍然可以保持实时检测。YOWOv2 在数据集 UCF101-24 上以超过 20 FPS 的速度实现了 87.0% 的视频帧 mAP 和 52.8% 的全视频 mAP。在数据集 AVA 上，YOWOv2 在提速 20 FPS 的同时实现了 21.7% 的视频帧 mAP。

Overview of YOWOv2YOWOv2

旨在检测不同规模的动作目标。为此，它精心构建了一个简单高效的二维骨干，带有特征金字塔网络，以提取不同级别的分类特征和回归特征。对于三维主干，YOWOv2 采用现有的高效架构 3D CNN 来节省开发时间。通过结合不同尺寸的三维和二维骨干，YOWOv2 公开了一系列高效的实时动作检测预训练模型，包括 YOWOv2-Tiny、YOWOv2-Medium 和 YOWOv2-Large。另外，该框架还引入了流行的动态标签分配策略和anchor-free机制，使 YOWOv2 紧跟先进的目标检测模型架构设计。

YOWOv2：优秀的实时视频动作检测框架

Zilliz

引用和评论

成本最高直降50倍! Zilliz Cloud Serverless Beta上线，限时免费，早用早省钱！

通过阿里云Milvus与通义千问VL大模型，快速实现多模态搜索

Orange Pi 5 Pro-RK3588(s)开发板快速入门

中免日上使用阿里云向量检索服务 Milvus 版搭建在线推荐系统

微帧WZVQA：极致还原人眼感知，精准评估视频画质

高效向量检索实践：阿里云百炼生成+Milvus存储技术方案解析

书籍-《激光雷达遥感入门与应用》