为了使得视觉与学习领域相关从业者快速及时地了解领域的最新发展动态和前沿技术进展,VALSE最新推出了《论文速览》栏目,将在每周发布一至两篇顶会顶刊论文的录制视频,对单个前沿工作进行细致讲解。本期VALSE论文速览选取了来自北京交通大学和电子科技大学的图像拼接矩形化方面的工作。该工作由林春雨教授指导,论文第一作者聂浪博士录制。
论文题目:Deep Rectangling for Image Stitching: A Learning Baseline
作者列表:聂浪 (北京交通大学),林春雨 (北京交通大学,通讯作者),廖康 (北京交通大学),刘帅成 (电子科技大学),赵耀 (北京交通大学)
B站观看网址:
https://www.bilibili.com/video/BV1cW4y1z7Q1/
论文摘要:
图像拼接提供了更大的FOV,但却带来了不规则的边界,不仅影响了视觉体验,也为下游任务带来了负面影响。为了解决这个问题,传统的图像矩形化方法致力于搜索初始mesh并优化目标mesh来找到矩形化的warp映射。但这种方法严重依赖于线段检测的性能,在一些具有丰富非线性结构的场景下 (如风景、人像)容易产生畸变。
在本文中,我们提出第一个图像矩形化的深度学习baseline来解决这些问题。具体来说,我们预先定义了一个规则的目标mesh,然后利用神经网络预测对应的初始mesh,将原来两阶段的传统矩形化pipeline简化为了一阶段的回归问题。为了预测得到更合适的warp映射,我们在网络中设计了残差渐进式的回归策略并提出了一个综合性的目标函数,同时鼓励边界矩形、mesh形状保持和内容自然。此外,我们构建了第一个包含了大量不规则边界和丰富场景的图像矩形化数据
论文题目:Deep Rectangling for Image Stitching: A Learning Baseline
作者列表:聂浪 (北京交通大学),林春雨 (北京交通大学,通讯作者),廖康 (北京交通大学),刘帅成 (电子科技大学),赵耀 (北京交通大学)
B站观看网址:
https://www.bilibili.com/video/BV1cW4y1z7Q1/
论文摘要:
图像拼接提供了更大的FOV,但却带来了不规则的边界,不仅影响了视觉体验,也为下游任务带来了负面影响。为了解决这个问题,传统的图像矩形化方法致力于搜索初始mesh并优化目标mesh来找到矩形化的warp映射。但这种方法严重依赖于线段检测的性能,在一些具有丰富非线性结构的场景下 (如风景、人像)容易产生畸变。
在本文中,我们提出第一个图像矩形化的深度学习baseline来解决这些问题。具体来说,我们预先定义了一个规则的目标mesh,然后利用神经网络预测对应的初始mesh,将原来两阶段的传统矩形化pipeline简化为了一阶段的回归问题。为了预测得到更合适的warp映射,我们在网络中设计了残差渐进式的回归策略并提出了一个综合性的目标函数,同时鼓励边界矩形、mesh形状保持和内容自然。此外,我们构建了第一个包含了大量不规则边界和丰富场景的图像矩形化数据
