4

clipboard.png

技术编辑:徐九丨发自 北京
SegmentFault 思否报道丨公众号:SegmentFault


谷歌的一个研究团队最近详细介绍了一个名为 SimCLR 的框架,该框架改进了之前的自我监督学习方法,这是一个将无监督学习问题(即 AI 模型在无标签数据上进行训练的问题)通过从无标签数据集中创建标签转化为有监督的问题的技术。

在一篇预印本论文和附带的博文中,谷歌表示 SimCLR 用有限的注释数据实现了图像分类的新纪录,而且它足够简单,可以被纳入现有的监督学习管道中。

这对于将计算机视觉应用于标签数据有限的领域的企业来说,可能是个好消息。

AI 框架 SimCLR

SimCLR 在一个未标记的语料库上学习基本的图像表示,并可以用一小部分标记的图像进行微调,以完成分类任务。这些表征是通过一种称为对比学习的方法来学习的,在这种方法中,模型同时将同一图像的不同变换视图之间的协议最大化,并将不同图像的变换视图之间的协议最小化。

图片描述

SimCLR 首先从原始数据集中随机抽取样本,通过裁剪、颜色扭曲和模糊,对每个样本进行两次变换,以创建两组相应的视图。然后,它使用机器学习模型计算出图像表示,之后,它使用模块生成图像表示的投影,最大限度地提高了 SimCLR 识别同一图像不同变换的能力。最后,在预训练阶段之后,SimCLR 的输出可以作为图像的表示,也可以用标签化的图像进行定制,以实现特定任务的良好表现。

谷歌表示,在实验中,当只对 1% 的标签进行测试时,SimCLR 在一个测试数据集(ImageNet)上实现了 85.8% 的准确率,而之前最好的方法是 77.9%。

"我们的结果表明,在大型非标签图像数据集上的预训练有可能提高计算机视觉任务的性能,"研究科学家 Ting Chen 和谷歌研究副总裁兼工程研究员、图灵奖获得者 Geoffrey Hinton 在一篇博文中写道。"尽管它很简单,但 SimCLR 极大地推进了自我监督和半监督学习的技术水平。"

SimCLR 作者介绍

SimCLR 的一作 Ting Chen,于 2017 年 6 月加入谷歌,2019 年加入谷歌大脑团队担任研究科学家。根据其个人媒体资料展示,2013 年本科毕业于北京邮电大学,于 2019 年 3 月获得加州大学洛杉矶分校计算机科学系博士学位。

作者个人网址:
http://web.cs.ucla.edu/~tingc...
GitHub 地址:
https://github.com/google-res...
资料来源:
https://venturebeat.com/2020/...

clipboard.png


阿遂
10k 声望906 粉丝

老编辑,深夜撰稿者。