近日,东北大学秦皇岛分校计算机与通信工程学院刘学聪老师与国防科技大学于起峰院士团队合作完成的研究成果,以“CRFT: Consistent-Recurrent Feature Flow Transformer for Cross-Modal Image Registration”为题发表在计算机视觉领域国际顶级会议CVPR 2026(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CCF A)上。该论文由东北大学作为第一完成单位,我校刘学聪老师为第一作者,本科生丁梦竹为第二作者(学生一作),国防科技大学滕锡超老师为通讯作者。

该研究面向遥感影像智能解译、无人系统视觉导航等场景中的跨模态图像配准需求,聚焦光学—SAR、可见光—红外等多源影像在成像机理、辐射响应和几何形变方面差异显著,导致高精度空间对应关系难以建立的问题。传统光流方法通常依赖光度一致性假设,难以直接适用于跨模态影像中普遍存在的非线性外观差异和复杂空间失真。针对这一挑战,论文提出一致性递归特征流Transformer(Consistent-Recurrent Feature Flow Transformer, CRFT),将跨模态图像配准建模为模态无关特征空间中的可学习特征流估计任务。

方法上,CRFT构建了由粗到精的统一配准框架:在粗匹配阶段,通过多尺度特征相关性建立稳定的全局对应关系;在精细匹配阶段,融合局部高分辨率结构信息,提升细粒度定位能力;进一步引入基于空间几何变换模块SGT的差异引导注意力与递归优化机制,通过迭代校正流场误差,增强模型对大尺度仿射变换、旋转尺度变化以及跨模态外观差异的适应能力。该框架实现了特征对齐与流场估计的联合优化,在保持全局几何一致性的同时提升了亚像素级配准精度。

实验结果表明,CRFT在光学—SAR与可见光—红外数据集上均取得优于现有代表性方法的配准精度和鲁棒性,尤其在亚像素阈值下表现突出。相关代码与数据集已公开,为多模态遥感图像智能分析、无人系统视觉导航等任务提供了技术参考。

该项研究得到河北省自然科学基金青年基金(F2025501003)和中央高校基本科研业务费(N2523014)的支持。该成果进一步展示了我校在计算机视觉、遥感影像智能处理与深度学习方法研究方面的持续积累。