效劳热线 0757-28900273
> > 注释
无需预练习分类器,清华&旷视提出公用于目的检测的主干网络DetNet
作者:
2018-04-20

本题目:无需预练习分类器,清华&旷视提出公用于目的检测的主干网络DetNet

选自arXiv

作者:Zeming Li、Chao Peng、Gang Yu、Xiangyu Zhang、Yangdong Deng、Jian Sun

机械之心编译

到场:路雪、刘晓坤

基于当前用预练习分类器开辟目的检测器的要领的固有缺点,来自清华大学和旷视的研究者提出了公用于目的检测的主干网络 DetNet。DetNet可正在连结高分辨率特性图和大感觉家的同时,高效天实行目的检测义务,并能够自然地扩展到实例支解义务上。正在 MSCOCO数据集的目的检测和实例支解义务上,DetNet皆获得了当前最好的效果。

目的检测是计算机视觉中最根蒂根基的义务之一。因为深度卷积神经网络(CNN)的快速生长,目的检测的机能也跟着明显提拔。


近期的基于 CNN的目的检测器能够被分类为 1阶段检测器(比方 YOLO、SSD和 RetinaNet),和 2阶段检测器(比方 R-CNN、R-FCN、FPN)。它们都是基于正在 ImageNet分类义务上预练习的主干网络。但是,图象分类和目的检测题目之间有一个明显的区分,后者不单单需求辨认目的实例的种别,借需求对界限框停止空间定位。具体来说,运用分类主干网络关于目的检测义务有两个题目:(1)近期的检测器如 FPN,包罗分外的阶段以正在差别标准上停止目的检测;(2)传统的主干网络基于大的下采样因子能够天生更高的感觉家,那关于视觉分类很有资助。但是,那却捐躯了空间分辨率,从而使网络难以正确天定位大型目的和辨认小型目的。

一个设想优越的检测主干应当处理以上一切题目。正在此论文中,研究者提出了 DetNet,那是专门去做目的检测的全新主干。更特其余是,由于差别的物体标准,DetNet具体来说,因为差别的目的标准,DetNet包罗了分外的阶段,正在别的目的检测器中的感化类似于 FPN。和传统的应用正在 ImageNet分类义务上预练习的模子差别,纵然包罗了分外的阶段,DetNet也能连结特性的空间分辨率。但是,因为盘算和内存开消,高分辨率的特性图给竖立深度神经网络带来了更大的应战。为了连结 DetNet的效力,研究者布置了一个低复杂度的扩大瓶颈构造。经由过程整合这些革新,DetNet不只连结了高分辨率的特性图,借连结了大的感觉家,二者对目的检测义务皆很重要。_4136.com

本研讨的孝敬以下:


  • 本文初次剖析了传统的将 ImageNet预练习模子微调去开辟目的检测器的固有缺点。

  • 本研讨经由过程连结空间分辨率和扩大感觉家,提出了一种新型的专为目的检测义务而设想的主干网络 DetNet。

  • 作者应用基于低复杂度的 DetNet59主干网路,正在 MSCOCO目的检测和实例支解追踪义务上获得了当前最好效果。


金沙js99011.com

图 1:FPN(特性金字塔网络)中运用的差别主干网络的对照。(A)FPN联合传统主干网络;(B)传统图象分类网络;(C)本文提出的 DetNet主干网络,其具有更高的空间分辨率,和 FPN有完全相同的各阶段。因为图象尺寸限定,图中没有显现阶段 1的特性图(步幅=2)。

3.2 DetNet设想


那局部引见 DetNet的构造细节。研究者运用 ResNet-50作为基线模子,其作为主干网络普遍用于大量目的检测器中。为了平正天取 ResNet-50停止对照,研究者使 DetNet的阶段 1、2、3、4取原始 ResNet-50的阶段保持一致。


建立高效的目的检测主干网络存在两项应战:连结深度神经网络的空间分辨率需求消耗大量工夫和内存;低落下采样因子即是削减有用的接管家,那对许多视觉义务都是有害的,如图象分类和语义支解义务。

DetNet经由细致设想以处理这两项应战。具体来说,DetNet遵照 ResNet的 4个阶段。区分从第 5个阶段最先,用于图象分类的 DetNet图示详见图 2D。上面我们来看从 ResNet50扩大而去的 DetNet59实现细节。相似天,DetNet能够运用深度层(正如 ResNet101)轻松扩大。DetNet59的设想细节以下:

  • 研究者引入了分外的阶段,比方 P6,其正在主干网络中的感化取 FPN中一样。同时,研究者流动空间分辨率为 16x下采样,纵然正在第 4阶段以后也是云云。

  • 因为第 4阶段后的空间分辨率是流动的,为了引入新的阶段,研究者正在每一个阶段刚开始时运用了扩大 [29,30,31]瓶颈和 1x1的卷积投影(图 2B),并发明图 2B中的模子关于多阶段检测器(如 FPN)非常重要。

  • 研究者运用扩大瓶颈作为根蒂根基网络模块,以高效扩大感觉家。因为扩大卷积仍旧斲丧大量工夫,阶段 5和阶段 6连结取阶段 4雷同的通道(瓶颈模块有 256个输入通道)。那取传统的主干网络设想差别,后者会在后面的阶段中将通道数目扩大为之前的 2倍。

将 DetNet和恣意具有/不具有特性金字塔的检测器整合到一同是很容易的。正在不损伤代表性的条件下,研究者接纳检测器 FPN作为基线网络,去考证 DetNet的功效。因为 DetNet只改动了 FPN的主干网络,因而研究者不改动 FPN的其他构造(除主干网络)。因为正在阶段 4以后并未削减 Resnet-50的空间分辨率巨细,因而只需根据自上而下的途径将一切阶段的输出相加便可。

4实行

4136.com

图 2:DetNet(D)和基于 DetNet的 FPN(E)的细节构造。(A,B)展现了 DetNet中运用的差别的瓶颈模块。(C)展现了原始瓶颈模块。正在阶段 4之前,DetNet和 ResNet的设想是雷同的,而正在阶段 4以后将连结空间分辨率(比方阶段 5和 6)。

表 1:FPN联合差别的主干网络获得的效果。包孕正在 ImageNet分类义务上的尺度 top-1偏差。FLOPs是指盘算复杂度。借展现了 FPN正在 COCO数据集上的效果以探究这些主干网络对目的检测的有效性。

表 3:FPN正在差别 IoU阈值和差别边框标准上的均匀精度(AP)的对照。AP50是一个有用的评价分类才能的目标。AP85的评价需求对边框展望的正确定位。因而它能够考证本文要领的回归才能。上表还展现了差别标准的 AP以捕获主干网络中高分辨率特性图的影响。

9159澳门金沙游艺城

图 3:DetNet-59-NoProj的细节构造,它运用了图 1A中的模块以星散阶段 6(而原始的 DetNet-59运用图 1B中的模块去星散阶段 6)。设想 DetNet-59-NoProj的目标是考证包罗一个新型的语义阶段用于目的检测(正如 FPN)的重要性。

图 4:基于 DetNet-59的 FPN检测器效果。

表 7:正在 MSCOCO数据集上,本文的要领与其他顶尖要领目的检测效果的对照,基于简朴、有用的主干 DetNet-59,该模子逾越了先前所有的顶尖要领。值得注重的是,DetNet-59正在更少 FLOPs状况下便得到了更好的效果。

表 8:正在 MSCOCO数据集上,本文的要领与其他顶尖要领做实例支解的效果对照。得益于 DetNet-59,正在实例支解义务上 DetNet与得了新纪录。

图 5:基于 DetNet-59的 Mask R-CNN的实例支解效果展现。


论文:DetNet: A Backbone network for Object Detection

2015.AM

论文链接:https://arxiv.org/pdf/1804.06215.pdf

择要:无论是当前 YOLO、SSD、RetinaNet如许的一阶段要领,照样 Faster R-CNN、R-FCN和 FPN如许的二阶段检测器,这些基于 CNN的目的检测器一般皆实验间接从 ImageNet预练习模子停止微调。而很少有研讨讨论用主干特性提取器专门做目的检测。更主要的是,图象分类和目的检测义务间有多个区分:(i)FPN和 RetinaNet如许的目的检测器一般要比图象分类义务有更多阶段,从而处置惩罚多标准的物体。(ii)目的检测不但需求辨认物体样例的种别,也需求空间定位其位置。大的下采样因子带来大的有用感觉家,那对图象分类有优点,却会折损目的定位的才能。由于图象分类和目的检测间的差异,我们正在此论文中提出了 DetNet,那是一种专门为目的检测设想的全新主干网络。另外,正在更深层中保持下空间分辨率的同时,DetNet借包罗取传统图象分类主干网络差别的分外阶段。基于我们提出的 DetNet(4.8G FLOPs)主干,正在 MSCOCO数据集基准上与得了目的检测和示例支解确当前最好效果。复现代码将正在近期公布。

本文为机械之心编译,转载请联络本民众号得到受权

✄------------------------------------------------

到场机械之心(全职记者/实习生):hr@jiqizhixin.com

投稿或追求报导:editor@jiqizhixin.com_金沙js99011.com

告白&商务协作:bd@jiqizhixin.com

稀奇推荐
publisher
2018-01-22 16:15
567
publisher
2018-01-16 14:58
733
publisher
2018-01-15 15:18
444
publisher
2018-01-09 16:32
349
publisher
2018-01-05 15:33
731