如何让机器智能“观色”?人脸表情数据功不可没

faddiddn

察言观色是全面分析人物的重要依据。而在计算机视觉领域,如果能够通过识别一个人的表情以观其色,即可为场景中出现的人物提供辅助的结构化信息。

例如,华为与波兰盲人协会合作,开发了一款能够“读懂他人情绪”的 Facing Emotions 应用。这项应用是面向视障人群开发的,当盲人用户与另一个人说话时,手机的后置摄像头会扫描对方的面部。Facing Emotions 能够分辨七种基本情绪,然后通过手机扬声器,来听到特定情绪的“提示音”。

image.png

华为面向视障者开发了 Facing Emotions

AI识别的巅峰是理解,理解人类情绪的通道是表情,无论是娱乐领域、商业领域对用户或者客户的情绪进行分析,还是安全领域对犯人或特定人群的表情进行解读,都需要用到表情识别。

表情识别技术是人脸识别技术的一个分支,随着人工智能技术和计算机技术的发展,表情识别技术可通过在静态图像或动态视频序列中分离出特定的表情状态,确定被识别对象的心理情绪。

01

表情识别的关键技术

那么,表情识别是如何实现的?具体而言,表情识别可分为三部分:人脸图像的获取与预处理、表情特征提取和表情分类。

人脸关键点检测就是定位人脸特定位置,并通过关键点位置组合获得抽象的人脸姿态信息,用统计的方法对人脸建模,比较待检测区域与人脸模型的匹配程度,从而得到可能存在人脸的区域。

image.png

关键点检测是人脸图像的获取与预处理环节的关键技术

表情特征的提取根据图像性质的不同可分为:静态图像特征提取和序列图像特征提取。静态图像中提取的是表情的形变特征,即表情的暂态特征。而对于序列图像不仅要提取每一帧的表情形变特征,还要提取连续序列的运动特征。

02

表情识别训练数据

人类的面部表情至少有21种,除了常见的高兴、吃惊、悲伤、愤怒、厌恶和恐惧6种,还有惊喜(高兴+吃惊)、悲愤(悲伤+愤怒)等15种可被区分的复合表情。表情识别的精度对于AI的应用来说至关重要,是AI读懂人的基础,也是人工智能行业目前难度最大的。

image.png

人有多种面部表情,提升识别精度至关重要

如何对上述复杂的表情进行准确识别?表情识别训练数据是重中之重。优质的训练数据是表情识别技术在具体场景中发挥价值的关键。人脸相关的应用做到商业化落地的中间自然离不开AI训练数据的支持。

数据堂对海量人脸面部表情原始数据进行框选、提取、分类等一系列处理,将混杂数据转化为机器学习可识别的专业数据,设计并研发了《26,129人多人种7种表情识别数据》、《1,000人3D表情识别数据》,为表情识别的发展提供助力。数据堂严格遵守相关规定,所采集的数据均已获得被采集人授权,保障了数据的安全合规。

26,129人多人种7种表情识别数据

image.png

多人种7种表情识别数据,已获得被采集人授权

该数据由17,945位黄种人、3,546位白种人、3,727位黑种人、911位棕色人(墨西哥人)参与录制,其中男性 13,963人,女性 12,166人。工作人员采集每位被采集者正常、高兴、惊奇、悲伤、愤怒、厌恶、恐惧的7种表情,数据多样性涵盖了不同脸部姿态、不同光照和不同场景。以表情准确度为准,精度超过97%,表情命名准确率也在97%以上。

1,000人3D表情识别数据

image.png

3D表情识别数据,已获得被采集人授权

工作人员使用带有3D结构光模组的苹果手机对每位被采集者采集24张照片,数据覆盖了正常光、强光、弱光3种光照条件,涵盖了被采集者静默、戴口罩(正脸)、抬头、低头、左转头、右转头、头左偏、头右偏8种姿态,正常、高兴、惊奇、悲伤、愤怒、厌恶、恐惧的7种表情。工作人员对被采集者的人种、性别、年龄和采集场景进行标注,同时用标签标注图片对应的动作、光照条件。按照采集动作准确度为准,数据精度超过97%,标签标注准确率也在97%以上。

03

数据堂数据定制服务

数据堂在深刻理解表情识别应用场景的基础上,为满足客户的个性化需求,推出了数据定制服务。数据堂的数据定制服务包括数据采集和数据标注两个部分。

数据堂支持多种场景多种类型的数据采集需求,采集内容涵盖图像、文本、语音、视频等全维度数据。

数据堂从事过多个百万级图像采集项目,包括人像、车辆、图标LOGO、指定物体等图像数据,可以按时完成客户在通用场景下的图像采集任务,高效并且保障数据质量。

数据堂拥有专业的数据采集设备、丰富的数据采集项目经验及数据质量管控经验。在数据采集过程中,数据堂严格遵守GDPR个人隐私数据保护相关条例,并已通过ISO27001信息安全管理体系认证,为数据安全全面护航。

image.png

人脸表情图像采集样例,以获得被采集人授权

数据堂拥有强大易用的模板编辑器帮助用户轻松发布任务,支持一站式自助下单。配置3个大型数据处理基地,5000名以上经验丰富的专业标注人员进行全人工标注,保障了作业的优质高效。标注过程中进行实时质量管控,这样能够有效保障项目流程中的标注数据质量,确保交付速度。

计算机和机器人如果能够像人类那样具有理解和表达情感的能力,将从根本上改变人与计算机之间的关系,使计算机能够更好地为人类服务。表情识别技术一旦成熟,其带来的益处将不仅仅是工业级的,更是贴近最广大的消费者。当情绪可以被当作读懂自己的镜子,人们也就可以获得更多来自他“人”的理解,从而解决更多实际生活中的难题。

阅读 316

1 声望
0 粉丝
0 条评论
1 声望
0 粉丝
文章目录
宣传栏