大尺度位移光流的语义插值
SemFlow: Semantic-Driven Interpolation for Large Displacement Optical Flow
大尺度位移光流的语义插值
光流场包含了观测环境丰富的运动信息,对于在动态环境中的视觉定位问题有很大的辅助意义。团队观察到传统插值方案的不足之处,提出了一个利用语义信息辅助的光流插值方案。首先使用语义信息对超像素分割结果进行优化,使得每一个优化后的超像素可以近似成平面。对于优化后的超像素,使用单应矩阵模型估计前后帧的投影关系,从而计算光流结果。相对于传统的仿射变换模型,该模型更能精确反映两帧之间的投影关系,从而能够达到更精确的结果。实验结果表明,相对于传统的插值方案,新提出的方案能够大幅提升光流的估计精度,尤其针对大尺度的位移场景,提升效果更为明显。
图1 算法流程图
图2 利用语义信息对超像素进行改善。(a)原来的超像素 (b)改善后的超像素
图3 数据集上的对比效果,从上到下分别是原图像,真值,Epic方法,Ric方法,本文工作
本文链接:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8692402