全文5352字,预计阅读时间14分钟
随着短视频的快速发展以及安全管理的需求不断增多,视频领域的相关技术应用包括视频智能标签、智能教练、智能剪辑、智能安全管理、文本视频检索、视频精彩片段提取、视频智能封面正逐渐成为人们生活中的重要部分。
以视频相关业务为例,短视频网站希望能迅速给每个新作品打上标签并推送给合适的用户,剪辑人员希望从比赛视频中便捷地提取精彩比赛片段集锦,教练员希望系统分析运动员的动作并进行技术统计和分析,安全管理部门也希望能精准地进行视频内容审核比如实时识别违规行为,编辑人员希望通过文本检索相关的视频片段作为新闻素材,广告或推荐网站希望为视频生成更加美观的封面提升转化率。这些业务对传统的人工处理方式是很大的挑战。
视频理解是通过AI技术让机器理解视频内容,如今在短视频、推荐、搜索、广告,安全管理等领域有着广泛的应用和研究价值,像动作定位与识别、视频打标签、文本视频检索、视频内容分析之类的任务都可以通过视频理解技术搞定。
PaddleVideo是百度自主研发的产业级深度学习开源开放平台飞桨的视频开发套件,包含视频领域众多模型算法和产业案例,本次开源主要升级点如下:
- 发布10个视频领域产业级应用案例,涵盖体育、互联网、医疗、媒体和安全等行业。
- 首次开源5个冠军/顶会/产业级算法,包含视频-文本学习、视频分割、深度估计、视频-文本检索、动作识别/视频分类等技术方向。
- 配套丰富的文档和教程,更有直播课程和用户交流群,可以与百度资深研发工程师一起讨论交流。
一、十大视频场景化应用-工具详解
飞桨PaddleVideo基于体育行业中足球/篮球/乒乓球/花样滑冰等场景,开源出一套通用的体育类动作识别框架;针对互联网和媒体场景开源了基于知识增强的大规模多模态分类打标签、智能剪辑和视频拆条等解决方案;针对安全、教育、医疗等场景开源了多种检测识别案例。百度智能云结合飞桨深度学习技术也形成了一系列深度打磨的产业级多场景动作识别、视频智能分析和生产以及医疗分析等解决方案。
1. 足球场景:
开源FootballAction精彩片段智能剪辑解决方案
FootballAction基于行为识别PP-TSM模型、视频动作定位BMN模型和序列模型AttentionLSTM组合得到,不仅能准确识别出动作的类型,而且能精确定位出该动作发生的起止时间。目前能识别的动作类别有8个,包含:背景、进球、角球、任意球、黄牌、红牌、换人、界外球。准确率超过90%。
2. 篮球场景:
开源BasketballAction精彩片段智能剪辑解决方案
篮球案例BasketballAction整体框架与FootballAction类似,共包含7个动作类别,分别为:背景、进球-三分球、进球-两分球、进球-扣篮、罚球、跳球。准确率超过90%。
3. 乒乓球场景:
开源大规模数据训练的动作分类模型
在百度Create 2021(百度AI开发者大会)上,PaddleVideo联合北京大学一同发布的乒乓球动作进行识别模型,基于超过500G的比赛视频构建了标准的训练数据集,标签涵盖发球、拉、摆短等8个大类动作。其中起止回合准确率达到了97%以上,动作识别也达到了80%以上。
4. 花样滑冰动作识别
使用姿态估计算法提取关节点数据,最后将关节点数据输入时空图卷积网络ST-GCN模型中进行动作分类,可以实现30种动作的分类。飞桨联合CCF(中国计算机学会)举办了花样滑冰动作识别大赛,吸引了300家高校与200家企业超过3800人参赛,冠军方案比基线方案精度提升了12个点,比赛top3方案已经开源。
<section style="line-height: 1.75em;margin-left: 8px;margin-right: 8px;"><img class="rich_pages wxw-img img_loading __bg_gif" data-ratio="0.6818181818181818" data-s="300,640" data-src="https://mmbiz.qpic.cn/mmbiz_gif/sKia1FKFiafgiaX1R7zzZ8VEK4KUr1d1wu6r9NoGCS34WwxtxJk3lSLpL0yTWzE1BTydrDYibSGZMdd0onZQ9XG22Q/640?wx_fmt=gif" data-type="gif" data-w="352" style="white-space: normal; width: 252px !important; height: 172.667px !important;" _width="268px" src="https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/25dde51c3b8645e2908578423e5899cb~tplv-k3u1fbpfcp-zoom-1.image" data-order="3" alt="图片"></section> | <section style="line-height: 1.75em;margin-left: 8px;margin-right: 8px;"><img class="rich_pages wxw-img img_loading __bg_gif" data-ratio="0.6818181818181818" data-s="300,640" data-src="https://mmbiz.qpic.cn/mmbiz_gif/sKia1FKFiafgiaX1R7zzZ8VEK4KUr1d1wu6xTHuFR2gOeyaOkmTdiayoyy4TibyoKicwAenEO0U0iaDXAIBfzdbDeJgdg/640?wx_fmt=gif" data-type="gif" data-w="352" style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, "Helvetica Neue", "PingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif; white-space: normal; text-align: center; width: 252px !important; height: 172.667px !important;" _width="268px" src="https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/fcd066d6da8b4f06b1422921cf9f6876~tplv-k3u1fbpfcp-zoom-1.image" data-order="4" alt="图片"></section> |
<section style="text-align: center;line-height: 1.75em;margin-left: 8px;margin-right: 8px;"><span style="display: none;line-height: 0px;letter-spacing: 1px;"></span><img class="rich_pages wxw-img img_loading __bg_gif" data-backh="147" data-backw="262" data-ratio="0.5625" data-s="300,640" data-src="https://mmbiz.qpic.cn/mmbiz_gif/sKia1FKFiafgiaX1R7zzZ8VEK4KUr1d1wu6JBmFRbukrIPGGb2eN6d4S6ECZ31bzDL2v38aVLGuLTwpfFP4aibUz1Q/640?wx_fmt=gif" data-type="gif" data-w="640" style="width: 252px !important; height: 142.917px !important;" _width="100%" src="https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/a20742f3cea84ac08d2c920c5f31122b~tplv-k3u1fbpfcp-zoom-1.image" data-order="5" alt="图片"><span style="display: none;line-height: 0px;letter-spacing: 1px;"></span></section> | <section style="line-height: 1.75em;margin-left: 8px;margin-right: 8px;"><img class="rich_pages wxw-img img_loading __bg_gif" data-backh="150" data-backw="267" data-ratio="0.5627198124267292" data-s="300,640" data-src="https://mmbiz.qpic.cn/mmbiz_gif/sKia1FKFiafgiaX1R7zzZ8VEK4KUr1d1wu6iaxtjm7ialEqplticW399heoX3EpSyWyiaSmB3xUhqDNibNz9noAD1hfQtw/640?wx_fmt=gif" data-type="gif" data-w="853" style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, "Helvetica Neue", "PingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif; white-space: normal; text-align: center; width: 252px !important; height: 142.971px !important;" _width="100%" src="https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/fa466c5cae9b4b639ccdb7668d3a55d2~tplv-k3u1fbpfcp-zoom-1.image" data-order="6" alt="图片"></section> |
<section style="line-height: 1.75em;margin-left: 8px;margin-right: 8px;"><img class="rich_pages wxw-img __bg_gif" data-ratio="1.0186915887850467" data-s="300,640" data-src="https://mmbiz.qpic.cn/mmbiz_gif/sKia1FKFiafgiaX1R7zzZ8VEK4KUr1d1wu6p5tDibOT1L2Jk1ibLiab4w0jPBeJBB5WZxJw3X4yBVTibx6iba98DYONVZA/640?wx_fmt=gif" data-type="gif" data-w="214" style="white-space: normal; width: 207px !important; height: auto !important; visibility: visible !important;" _width="207px" src="https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/898b2089761247539f3bedd98b55aa49~tplv-k3u1fbpfcp-zoom-1.image" data-order="9" alt="图片" data-fail="0"><span style="display: none;line-height: 0px;letter-spacing: 1px;"></span></section> | <section style="line-height: 1.75em;margin-left: 8px;margin-right: 8px;"><img class="rich_pages wxw-img __bg_gif" data-galleryid="" data-ratio="0.7686567164179104" data-src="https://mmbiz.qpic.cn/mmbiz_gif/sKia1FKFiafgiaX1R7zzZ8VEK4KUr1d1wu6dMwxsdptlH90RN7BZzCbdyuwwJB9xfVzwSjrZWybPYiaHAXVYNbyWGA/640?wx_fmt=gif" data-type="gif" data-w="536" style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, "Helvetica Neue", "PingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif; white-space: normal; text-align: center; width: 268px !important; height: auto !important; visibility: visible !important;" _width="268px" src="https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/510f01b52b5d46b2aedae5debbe85eee~tplv-k3u1fbpfcp-zoom-1.image" data-order="10" alt="图片" data-fail="0"></section> |
<section style="line-height: 1.75em;margin-left: 8px;margin-right: 8px;"><img class="rich_pages wxw-img img_loading __bg_gif" data-ratio="0.8" data-s="300,640" data-src="https://mmbiz.qpic.cn/mmbiz_gif/sKia1FKFiafgiaX1R7zzZ8VEK4KUr1d1wu6uVaicongxDosZR9AqFcE4tG3u80fibIvvGMHLE9XlibaH3zPV1m261iasQ/640?wx_fmt=gif" data-type="gif" data-w="640" style="white-space: normal; width: 252px !important; height: 202.133px !important;" _width="268px" src="https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/abb864ca0fd84ca7a6d7b89ab3cba3d7~tplv-k3u1fbpfcp-zoom-1.image" data-order="11" alt="图片"></section> | <section style="line-height: 1.75em;margin-left: 8px;margin-right: 8px;"><img class="rich_pages wxw-img img_loading __bg_gif" data-ratio="0.8" data-s="300,640" data-src="https://mmbiz.qpic.cn/mmbiz_gif/sKia1FKFiafgiaX1R7zzZ8VEK4KUr1d1wu6Hfd8SpFpyYBwtmjeEL5lYw79v7TIXjQsu87gXiagn736vjFEwaibLrqQ/640?wx_fmt=gif" data-type="gif" data-w="640" style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, "Helvetica Neue", "PingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif; white-space: normal; text-align: center; width: 252px !important; height: 202.133px !important;" _width="268px" src="https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/14611978c5044f379294b27a3b173879~tplv-k3u1fbpfcp-zoom-1.image" data-order="12" alt="图片"></section> |
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。