立体匹配的多维残差密集注意力网络

  

  Multi-Dimensional Residual Dense Attention Network for Stereo Matching 

  立体匹配的多维残差密集注意力网络 

  卷积神经网络(CNNs)近年来在立体匹配方面取得了很大的成功。学习一个健壮的特征映射以改善不适定区域,例如弱纹理区域、反射面和重复模式仍然是非常可取的。本文提出了一种端到端的多维残差密集注意力网络(MRDA-Net),重点研究了更全面的像素级特征提取部分。该网络由两部分组成:用于特征提取的二维残差密集注意力网络和用于匹配的三维卷积关注网络。设计的二维残差稠密注意力网络采用密集网络结构,充分利用前一卷积层的层次特征,利用残差网络结构融合低层结构信息和高级语义信息。该网络的二维注意力模块旨在自适应地重新校准信道上的特征,以便更多地关注信息特征。本文提出的三维卷积注意力网络进一步扩展了匹配的注意机制。利用网络中的沙漏叠加模块,提取多尺度的上下文信息和几何信息。该三维关注模块自适应地将层次化的子代价体代替人工聚集,从而实现了对代价体的综合调整,从而提高了视差计算的准确性。实验表明,该方法在Scene Flow数据集、KITTI2012KITTI2015双目数据集上达到了最先进的精度。 

  

 

  1. MRDA-Net概述。将左、右图像输入共享特征提取模块,包括浅特征提取模块、叠加残差密集关注模块和下采样模块。利用左、右特征卷获得一个4d特征体,该特征体被输入由叠加沙漏模块和三维注意模块组成的匹配网络中。 

    

  

 

  2. Scene Flow数据集上对不同算法做立体匹配的可视化结果。结果表明,本文使用的方法改善了具有挑战性的病态区域,如最左边的遮挡、细节区域和平面区域。  

    

本文链接:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8694010