人工智能行业有句话:有多少智能,背后就有多少人工。随着大数据、云计算和人工智能等技术飞速发展,数据标注服务逐渐走入人们视野,成为新形势下商业价值凸显的重要抓手。
数据标注就是机器学习的过程,数据标注员使用自动化的工具从互联网上抓取、收集数据包括文本、图片、语音等等,并对抓取的数据进行整理与标注, 他们的工作是教会AI认识数据,依据这些大量而有效的数据总结规律,教导AI像人一样去感知、思考和决策,最终形成自己的工作模式,更好地为人类服务。
行业背景
一个算法经过越多数据的训练,它的精确度就越高,换言之,AI行业将一直需要更多准确注解与标注的数据。如今全球巨头企业纷纷发展人工智能,2020年全球数据标注工具市场已达4940亿美元,预计2021年至2028年将以27.1%的复合年增长率(CAGR)增长。其快速更迭的主要动力来自于图像数据标注的日益普及,根据标注类型,市场上主要分为手动、半监督和自动三种,其中手动数据标注最受欢迎,因为它具备准确性、完整性及关联性优势,可以更好的集成至算法中,为汽车、零售、医疗保健与金融等领域提供数据支持。
印度市场
标记训练数据集是一项复杂、耗时且需要大量劳力的繁琐工作,印度作为世界排名第二的人口大国,为数据标注提供了一个庞大的人才库,该国科技行业的外包热潮使其成为这种精密工作发展的温床。印度软件与服务业企业协会(Nasscom)高级副总裁兼首席战略官Sangeeta Gupta表示:“在印度,这算是一个新兴的行业……大家渐渐意识到这一行业即将开启的巨大机遇。人工智能需要借助于被正确注解、分类和进行匿名处理的数据。在这件事上,无论人们观念如何,除了自动化手段以外,娴熟的工人同样必不可少,这便是印度的机遇。”
转型之路
Open Text产品营销高级总监Lori Mc Kellar认为:“在这个日益数字化的世界中,印度的人员和技能将成为多年的关键资源。”在经历世纪之交业务流程外包的热潮之后,越来越多用来训练人工智能的数据集被打上了“企业专有权”的标签,印度人对这些企业的需求和所用术语并不陌生。和业务流程外包类似,数据标注重在对工作流程的管理,其所需技能即使是高中学历的人也可以通过训练掌握,这种低薪+低技能的工作,使拥有同等条件的罗马尼亚、印度尼西亚、越南、菲律宾等其他发展中经济体也将有机会跟进并加入这一领域。
因此想在标注市场保持领先地位,企业和数据标注团队在需求、质量控制、反馈和成果交付方面的互动应更加紧密,正如Cranberry首席执行官兼创始人Shishir Thakur所言:“只有通过为高复杂性和中高水平技术能力的人工智能服务才是我们不被取代的出路。”
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。