晓飞的算法工程笔记 - SegmentFault 思否

PSS：你距离NMS-free+提点只有两个卷积层 | 2021论文

VincentLee

2022-06-27

阅读 4 分钟

869

论文提出了简单高效的PSS分支，仅需在原网络的基础上添加两个卷积层就能去掉NMS后处理，还能提升模型的准确率，而stop-grad的训练方法也挺有意思的，值得一看来源：晓飞的算法工程笔记公众号

CAP：多重注意力机制，有趣的细粒度分类方案 | AAAI 2021

VincentLee

2022-06-24

阅读 5 分钟

1.1k

论文提出细粒度分类解决方案CAP，通过上下文感知的注意力机制来帮助模型发现细微的特征变化。除了像素级别的注意力机制，还有区域级别的注意力机制以及局部特征编码方法，与以往的视觉方案很不同，值得一看来源：晓飞的算法工程笔记公众号

NFNet：NF-ResNet的延伸，不用BN的4096超大batch size训练 | 21年论文

VincentLee

2022-06-23

阅读 6 分钟

939

论文认为Batch Normalization并不是网络的必要构造，反而会带来不少问题，于是开始研究Normalizer-Free网络，希望既有相当的性能也能支持大规模训练。论文提出ACG梯度裁剪方法来辅助训练，能有效防止梯度爆炸，另外还基于NF-ResNet的思想将SE-ResNet改造成NFNet系列，可以使用4096的超大batch size进行训练，性能超越了E...

NF-ResNet：去掉BN归一化，值得细读的网络信号分析 | ICLR 2021

VincentLee

2022-06-22

阅读 7 分钟

988

论文提出NF-ResNet，根据网络的实际信号传递进行分析，模拟BatchNorm在均值和方差传递上的表现，进而代替BatchNorm。论文实验和分析十分足，出来的效果也很不错。一些初始化方法的理论效果是对的，但实际使用会有偏差，论文通过实践分析发现了这一点进行补充，贯彻了实践出真知的道理来源：晓飞的算法工程笔记公众号

Involution：空间不共享？可完全替代卷积的高性能算子 | CVPR 2021

VincentLee

2022-06-20

阅读 4 分钟

981

其实这篇文章很早就写好了，但作者其它论文涉及到洗稿问题，所以先放着了。目前看这篇文章没被举报有洗稿的嫌疑，所以就发出来了 . 来源：晓飞的算法工程笔记公众号

GFLV2：边界框不确定性的进一步融合，提点神器 | CVPR 2021

VincentLee

2022-06-17

阅读 4 分钟

1.2k

GFLV2基于GFLV1的bbox分布进行改进，将分布的统计信息融入到定位质量估计中，整体思想十分创新和完备，从实验结果来看，效果还是挺不错的来源：晓飞的算法工程笔记公众号

MobileNext：打破常规，依图逆向改造inverted residual block | ECCV 2020

VincentLee

2022-06-16

阅读 5 分钟

1.2k

论文深入分析了inverted residual block的设计理念和缺点，提出更适合轻量级网络的sandglass block，基于该结构搭建的MobileNext。根据论文的实验结果，MobileNext在参数量、计算量和准确率上都有更优的表现，唯一遗憾的是论文没有列出在设备上的实际用时，如果补充一下更好了来源：晓飞的算法工程笔记公众号

OWOD：开放世界目标检测，更贴近现实的检测场景 | CVPR 2021 Oral

VincentLee

2022-06-15

阅读 5 分钟

1.6k

不同于以往在固定数据集上测试性能，论文提出了一个更符合实际的全新检测场景Open World Object Detection，需要同时识别出未知类别和已知类别，并不断地进行增量学习。论文还给出了ORE解决方案，通过对比聚类和基于能量的分类器来进行开放开放世界的检测训练来源：晓飞的算法工程笔记公众号

DynamicHead：基于像素级路由机制的动态FPN | NIPS 2020

VincentLee

2022-06-14

阅读 4 分钟

918

论文提出了细粒度动态detection head，能够基于路由机制动态地融合不同FPN层的像素级局部特征进行更好的特征表达。从设计的路由空间来看是一个十分耗时的操作，但是作者设计的高效路由器实际计算十分高效。实验结果来看，细粒度动态detection head可以即插即提点来源：晓飞的算法工程笔记公众号

RepVGG：VGG，永远的神！ | CVPR 2021

VincentLee

2022-06-13

阅读 4 分钟

1.4k

RepVGG将训练推理网络结构进行独立设计，在训练时使用高精度的多分支网络学习权值，在推理时使用低延迟的单分支网络，然后通过结构重参数化将多分支网络的权值转移到单分支网络。RepVGG性能达到了SOTA，思路简单新颖，相信可以在上面做更多的工作来获得更好的性能。来源：晓飞的算法工程笔记公众号

SoftPool：基于Softmax加权的池化操作 | 2021新文

VincentLee

2022-04-29

阅读 3 分钟

SoftPool使用softmax进行加权池化，能够保持特征的表达性并且是可微操作。从性能和准确率来看，SoftPool是目前的常规池化方法的一个不错的替代品来源：晓飞的算法工程笔记公众号

ReLabel：自动将ImageNet转化成多标签数据集，更准确地有监督训练 | 2021新文

VincentLee

2022-04-28

阅读 4 分钟

1.4k

人工标注数据集中普遍存在噪声，ReLabel能够自动且低成本地将原本的单标签数据集转化为多标签数据集，并且提出配合random crop使用的高效LabelPooling方法，能够更准确地指导分类网络的训练来源：晓飞的算法工程笔记公众号

MicroNet: 低秩近似分解卷积以及超强激活函数，碾压MobileNet | 2020新文分析

VincentLee

2022-04-11

阅读 6 分钟

1.3k

论文提出应对极低计算量场景的轻量级网络MicroNet，包含两个核心思路Micro-Factorized convolution和Dynamic Shift-Max，Micro-Factorized convolution通过低秩近似将原卷积分解成多个小卷积，保持输入输出的连接性并降低连接数，Dynamic Shift-Max通过动态的组间特征融合增加节点的连接以及提升非线性，弥补网络深度减...

WeightNet：从SENet和CondConv得出的高效权值生成结构 | ECCV 2020

VincentLee

2022-03-30

阅读 4 分钟

1.1k

论文在权值空间将SENet和CondConv进行了总结，提出统一的框架WeightNet，能够根据样本特征动态生成卷积核权值，并且能通过调节超参数来达到准确率和速度间的trade-off 来源：晓飞的算法工程笔记公众号

RepLKNet：不是大卷积不好，而是卷积不够大，31x31卷积了解一下 | CVPR 2022

VincentLee

2022-03-21

阅读 7 分钟

1.4k

论文提出引入少数超大卷积核层来有效地扩大有效感受域，拉近了CNN网络与ViT网络之间的差距，特别是下游任务中的性能。整篇论文阐述十分详细，而且也优化了实际运行的表现，值得读一读、试一试来源：晓飞的算法工程笔记公众号

SAPD：FSAF升级版，合理的损失值加权以及金字塔特征选择 | ECCV 2020

VincentLee

2022-03-09

阅读 5 分钟

针对anchor-point检测算法的优化问题，论文提出了SAPD方法，对不同位置的anchor point使用不同的损失权重，并且对不同的特征金字塔层进行加权共同训练，去除了大部分人为制定的规则，更加遵循网络本身的权值进行训练来源：晓飞的算法工程笔记公众号

FoveaBox：细节差别，另一种DenseBox+FPN的Anchor-free方案 | IEEE TIP 2020

VincentLee

2022-03-07

阅读 3 分钟

1.2k

作为与FCOS和FSAF同期的Anchor-free论文，FoveaBox在整体结构上也是基于DenseBox加FPN的策略，主要差别在于FoveaBox只使用目标中心区域进行预测且回归预测的是归一化后的偏移值，还有根据目标尺寸选择FPN的多层进行训练，大家可以学习下来源：晓飞的算法工程笔记公众号

Guided Anchoring：在线稀疏anchor生成方案，嵌入即提2AP | CVPR 2019

VincentLee

2022-03-04

阅读 5 分钟

Guided Anchoring通过在线生成anchor的方式解决常规手工预设anchor存在的问题，以及能够根据生成的anchor自适应特征，在嵌入方面提供了两种实施方法，是一个很完整的解决方案来源：晓飞的算法工程笔记公众号

SaccadeNet：使用角点特征进行two-stage预测框精调 | CVPR 2020

VincentLee

2022-03-02

阅读 3 分钟

SaccadeNet基于中心点特征进行初步的目标定位，然后利用初步预测框的角点特征以及中心点特征进行预测框的精调，整体思想类似于two-stage目标检测算法，将第二阶段的预测框精调用的区域特征转化为点特征。SaccadeNet在精度和速度上都可圈可点，整体思想十分不错来源：晓飞的算法工程笔记公众号

FSAF：嵌入anchor-free分支来指导acnhor-based算法训练 | CVPR2019

VincentLee

2022-03-01

阅读 4 分钟

FSAF深入地分析FPN层在训练时的选择问题，以超简单的anchor-free分支形式嵌入原网络，几乎对速度没有影响，可更准确的选择最优的FPN层，带来不错的精度提升来源：晓飞的算法工程笔记公众号

FPT：又是借鉴Transformer，这次多方向融合特征金字塔 | ECCV 2020

VincentLee

2022-02-25

阅读 4 分钟

论文提出用于特征金字塔的高效特征交互方法FPT，包含3种精心设计的特征增强操作，分别用于借鉴层内特征进行增强、借鉴高层特征进行增强以及借鉴低层特征进行增强，FPT的输出维度与输入一致，能够自由嵌入到各种包含特征金字塔的检测算法中，从实验结果来看，效果不错来源：晓飞的算法工程笔记公众号

Anchor-free目标检测综述 -- Dense Prediction篇

VincentLee

2022-02-24

阅读 5 分钟

1.9k

早期目标检测研究以anchor-based为主，设定初始anchor，预测anchor的修正值，分为two-stage目标检测与one-stage目标检测，分别以Faster R-CNN和SSD作为代表。后来，有研究者觉得初始anchor的设定对准确率的影响很大，而且很难找到完美的预设anchor，于是开始不断得研究anchor-free目标检测算法，意在去掉预设anc...

Anchor-free目标检测综述 -- Keypoint-based篇

VincentLee

2022-02-23

阅读 5 分钟

1.6k

Non-local Network：人类早期在CV驯服Transformer尝试 | CVPR 2018

VincentLee

2022-02-22

阅读 3 分钟

1.4k

Non-local操作是早期self-attention在视觉任务上的尝试，核心在于依照相似度加权其它特征对当前特征进行增强，实现方式十分简洁，为后续的很多相关研究提供了参考来源：晓飞的算法工程笔记公众号

RelationNet++：基于Transformer融合多种检测目标的表示方式 | NeurIPS 2020

VincentLee

2022-02-21

阅读 5 分钟

1.4k

论文提出了基于注意力的BVR模块，能够融合预测框、中心点和角点三种目标表示方式，并且能够无缝地嵌入到各种目标检测算法中，带来不错的收益来源：晓飞的算法工程笔记公众号

轻量级网络综述 — 主干网络篇

VincentLee

2021-09-27

阅读 9 分钟

3.3k

轻量级网络的核心是在尽量保持精度的前提下，从体积和速度两方面对网络进行轻量化改造，本文对轻量级网络进行简述，主要涉及以下网络：SqueezeNet系列ShuffleNet系列MnasNetMobileNet系列CondenseNetESPNet系列ChannelNetsPeleeNetIGC系列FBNet系列EfficientNetGhostNetWeightNetMicroNetMobileNextSqueezeNet系列 Sque...

RelationNet：学习目标间关系来增强特征以及去除NMS | CVPR 2018

VincentLee

2021-07-29

阅读 5 分钟

2.7k

论文基于NLP的注意力机制提出了目标关系模块，通过与其它目标的比对增强当前目标的特征，而且还可以代替NMS进行端到端的重复结果去除，思想十分新颖，效果也不错来源：晓飞的算法工程笔记公众号

Generalized Focal Loss：Focal loss魔改以及预测框概率分布，保涨点 | NeurIPS 2020

VincentLee

2021-07-28

阅读 5 分钟

2.5k

为了高效地学习准确的预测框及其分布，论文对Focal loss进行拓展，提出了能够优化连续值目标的Generalized Focal loss，包含Quality Focal loss和Distribution Focal loss两种具体形式。QFL用于学习更好的分类分数和定位质量的联合表示，DFL通过对预测框位置进行general分布建模来提供更多的信息以及准确的预测。从实验...

FCOSv2：原作的扩展版本，小修小改，性能高达50.4AP | IEEE T-PAMI 2020

VincentLee

2021-07-27

阅读 2 分钟

1.6k

本文是对FCOS的小修小改，最终性能达到了50.4AP，可谓相当强劲了，大家在工程上可以参考其中的改进以及提升方法来源：晓飞的算法工程笔记公众号

Guided Anchoring：在线稀疏anchor生成方案，嵌入即提2AP | CVPR 2019

VincentLee

2021-07-13

阅读 5 分钟

1.3k