活动介绍
上海白玉兰开源开放研究院发起的“青年学者论坛”,意在为国内外大数据及人工智能领域的优秀青年学者,搭建一个非正式交流平台。我们诚邀发表在国际顶会的论文作者,以第一视角介绍其学术观点、研究细节、成果展现、相关领域前沿方向等话题,促进观点碰撞及交流合作。
此次是“青年学者论坛”第九期活动,青年学者论坛讲师及志愿者持续招募中。
如有意愿,请与我们联系,欢迎广大同学们积极参与。
Email:chengh@baiyulan.org.cn (邮件主题:青年学者论坛)
微信:chhao01 (验证消息:青年学者论坛)
活动安排
时间 | 议程 |
---|---|
20:00 – 20:05 | 本期介绍 |
20:05 – 20:50 | 议题:探索新的神经网络算子involution-李铎 |
20:50 – 21:30 | 评议+Q&A |
摘要
卷积作为现代神经网络中的核心构件,引发了深度学习技术在视觉领域的发展浪潮。在这篇工作中,我们重新思考了标准卷积核在空间维度和通道维度的固有特性,即空间不变性和通道特异性。与其相反地,我们通过反转以上的两个设计准则,提出了一种新颖的神经网络算子,称为“involution”。另外我们解释了最近应用广泛的自注意力操作,并将其作为一种复杂的特例归入了“involution”的范畴。
我们提出的“反转卷积”算子可以作为基础模块替代普通卷积来搭建新一代的视觉神经网络,在不同的视觉任务中支持多种多样的深度学习模型,包括ImageNet图像分类,COCO目标检测和实例分割,Cityscapes语义分割。基于“反转卷积”的深度神经网络相较于ResNet-50对应的卷积神经网络模型,在上述任务中分别将识别准确率提升1.6%,边界框AP提升2.5%和2.4%,类别平均IoU提升4.7%,而将计算代价压缩到66%,65%,72%和57%。
相关视觉任务的源代码和预训练模型开放在https://github.com/d-li14/involution讲师介绍
李铎,香港科技大学计算机系二年级研究生,本科毕业于清华大学自动化系,于 ICCV, CVPR, ECCV 发表顶会论文 10 篇,曾在 Intel,NVIDIA,SenseTime,ByteDance等公司实习,曾获 2020 年度 CCF-CV 学术新锐奖,其余信息详见个人主页https://duoli.org
评议人
晏轶超,上海交通大学助理教授,2019年博士毕业于上海交通大学电子工程系,主要研究方向为机器学习与计算机视觉,包括行人重识别、图像及视频生成、行为识别等。 在TPAMI、CVPR、ACM Multimedia等人工智能、计算机视觉及多媒体顶级会议和期刊发表论文20篇。曾担任阿联酋起源研究院研究科学家,IJCAI2021高级程序委员会成员。曾获得2020年度中国图象图形学学会优秀博士学位论文奖。
合作媒体
- CSDN
- 思否
- 掘金
- 数据与智能
- 示说
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。