通过增加context的信息来提高目标检测的准确率是一个常见的方法,在SSD当中,作者没有利用到context的信息,因此,作者在DSSD里面尝试通过加入context来改善SSD的性能。
Introduction
在SSD的研究基础上,本文的主要贡献可分为两点:首先,把SSD的基准网络从VGG换成了Resnet-101,增强了特征提取能力;然后使用反卷积层(deconvolution layer )增加了大量上下文信息。
下图基本上展示了论文的核心思想,也就是如何利用中间层的上下文信息。方法就是把红色层做反卷积操作,使其和上一级蓝色层尺度相同,再把二者融合在一起,得到的新的红色层用来做预测。如此反复,仍然形成多尺度检测框架。在图中越往后的红色层分辨率越高,而且包含的上下文信息越丰富,综合在一起,使得检测精度得以提升。

Deconvolution module
为了整合浅层特征图和反卷积层的信息,作者引入了如下图所示的反卷积模块,该模块可以适合整个DSSD架构。作者受到论文Learning to Refine Object Segments的启发,认为用于精细网络的反卷积模块的分解结构达到的精度可以和复杂网络一样,并且更有效率。作者对其进行了一定的修改:
- 在每个卷积层后添加批归一化层;
- 使用基于学习的反卷积层而不是简单地双线性上采样;
- 作者测试了不同的结合方式,元素求和(element-wise sum)与元素点积(element-wise product)方式,实验证明点积计算能得到更好的精度。
