图像全景语义分割是人工智能计算机视觉领域的一个重要分支,它结合了图像分类、目标检测与图像分割等技术,是针对图像数据所进行的一种像素级分类。
经过全景语义分割处理后的图像,广泛应用于自动驾驶、无人机等场景下的机器学习,是图像处理领域最常见的一种数据标注类型。
这是一张经过全景语义分割处理后的2D图像:
图1:自动驾驶图像全景语义分割
值得注意的是,图1只是经过语义分割处理后的“视觉直观图像”,并不能直接用于机器学习。在此张图像基础上导出的“JSON”格式以及“Mask”格式数据,才能被机器识别与应用。
一.JSON格式数据
JSON,英文全称为JavaScript Object Notation,是一种轻量级的数据交换格式,采用完全独立于编程语言的文本格式来存储和表示数据。
JSON格式,最早在2001年由Douglas Crockford提出,目的是取代繁琐笨重的XML格式。相较于XML格式,JSON格式有两个显著的优点:书写简单,一目了然;符合JavaScript原生语法,可以由解释引擎直接处理,不用另外添加代码。
这些优点让JSON格式迅速被接受,目前已经成为各大网站交换数据的标准格式,并被写入ECMAScript 5,成为标准的一部分。
在人工智能领域,由于JSON格式数据具有良好的可读和便于快速编写的特性,并可在不同平台之间进行数据交换,同时也具备类似于C语言的习惯(包括C, C++, C#, Java, JavaScript, Perl, Python等),使其成为标注数据集较为理想的数据导出格式。
以图1为例,经过SEED数据服务平台全景语义分割处理后,导出的JSON格式数据为:
JSON格式文件(截取部分内容)
相较于图像类数据,JSON数据以字符描述出图像中的相关信息,包含的内容包括更新时间、项目名称、数据集名称、颜色信息、点坐标信息、完成时间、标签名称等,将图像信息化,有效提取图像数据中的关键信息,完美契合机器学习的需求。
二.Mask图像格式数据
Mask,中文翻译为掩膜,概念起源于半导体制造业。
在半导体制造中,许多芯片工艺步骤采用光刻技术,用于这些步骤的图形“底片”称为掩膜(也称作“掩模”),其作用是:在硅片上选定的区域中对一个不透明的图形模板遮盖,继而下面的腐蚀或扩散将只影响选定的区域以外的区域。
在图像处理领域,Mask表示用选定的图像、图形或物体,对处理的图像(全部或局部)进行遮挡,来控制图像处理的区域或处理过程。
在数据标注领域,Mask图像可以用相似性变量或图像匹配方法检测和提取图像中与掩膜相似的结构特征,方便机器识别与学习。
同样以图1为例,经过SEED数据服务平台全景语义分割处理后,导出的Mask图像为:
Mask图像
相较于图1,Mask图像用色块覆盖原有标注对象,同一色块表示相同属性内容。Mask图像类数据集广泛应用于图像识别、目标分类等领域。
三.SEED平台数据导出格式
在一个完整的数据生命周期内,数据标注只占总体流程中的一部分,经过标注的数据只有经过导出处理,才能用于相关算法识别与学习。
目前,SEED数据服务平台全面支持各类型数据格式的导出,支持包括.json、.xml、.csv、.xls以及Mask等多种数据导出格式,满足不同类型算法模型的差异化需求。
同时,SEED数据服务平台还支持全景语义分割模式下的JSON+Mask双向数据导出,同一份数据只需标注一次,即可输出两种不同格式的结构化数据:
双向数据导出功能下,JSON+Mask无需转换,更无需重复导出,既可满足不同场景下的算法需求,同时也可避免重复劳动,提升生产效率。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。