零售业是劳动密集型行业,其中收银结算成本在总成本中占据相当比重。
随着深度学习发展,借助图像识别技术实现零售行业的降本增效已是大势所趋。
目前主要流行的一种智能货柜解决方案是“视觉识别解决方案”,即以图像识别为技术核心,摄像头、主板为硬件核心,对目标产品进行目标检测和分类,实现自动识别与结算,提升购物体验与节省人力成本。
目前,此类解决方案已经在部分地区开始商用。然而,在实际应用的过程中,部分问题也开始逐渐暴露,核心点集中于物品的识别准确率上。
智能货柜售卖的商品最常见的是饮料和盒装零食。在现实场景中,巡检的照片质量参差不齐,且实际场景中很难有理想的正面拍摄环境,同时不同商品种类外包装的可辨识度不高,容易混淆,这些问题都给计算机视觉算法的识别带来了巨大的困难。
众所周知,数据集质量的高低会极大的影响最终模型的效果。因此提高投喂的数据集质量,是解决此类问题的关键。
目前,新零售领域常用的数据标注类型主要有以下几种:
1. 2D框
标注出货柜上的商品:
2. 多边形
标注出取出的商品:
3.语义分割
对图片中的不同商品区域进行分割标注:
4.视频标注
标注出视频中人物持有的商品
场景化、精细化是目前数据标注行业的主要发展趋势,高质量的数据集将有效提升图像识别准确率,为新零售产业商业化落地增添新的活力。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。