零售业是劳动密集型行业,其中收银结算成本在总成本中占据相当比重。

随着深度学习发展,借助图像识别技术实现零售行业的降本增效已是大势所趋。​

目前主要流行的一种智能货柜解决方案是“视觉识别解决方案”,即以图像识别为技术核心,摄像头、主板为硬件核心,对目标产品进行目标检测和分类,实现自动识别与结算,提升购物体验与节省人力成本。

目前,此类解决方案已经在部分地区开始商用。然而,在实际应用的过程中,部分问题也开始逐渐暴露,核心点集中于物品的识别准确率上。

智能货柜售卖的商品最常见的是饮料和盒装零食。在现实场景中,巡检的照片质量参差不齐,且实际场景中很难有理想的正面拍摄环境,同时不同商品种类外包装的可辨识度不高,容易混淆,这些问题都给计算机视觉算法的识别带来了巨大的困难。

众所周知,数据集质量的高低会极大的影响最终模型的效果。因此提高投喂的数据集质量,是解决此类问题的关键。

目前,新零售领域常用的数据标注类型主要有以下几种:

1. 2D框

标注出货柜上的商品:

2. 多边形

标注出取出的商品:

3.语义分割

对图片中的不同商品区域进行分割标注:

4.视频标注

标注出视频中人物持有的商品

场景化、精细化是目前数据标注行业的主要发展趋势,高质量的数据集将有效提升图像识别准确率,为新零售产业商业化落地增添新的活力。


曼孚科技
15 声望17 粉丝

曼孚科技,用数据解放AI的一切可能。专注于数据服务领域,尤其是数据标注行业,用于自身独立研发的数据标注工具。