基于无序图像集的运动恢复结构研究与实现开题报告

 2022-08-26 16:18:01

全文总字数:4864字

1. 研究目的与意义(文献综述)

人眼通过接收外界可见光,经人脑中枢有关部分进行加工处理后获得外界环境的信息,称为视觉信息,占总获取总信息的七成。眼睛是人类认识和理解世界的主要器官。在计算机科学领域,人们尝试使用相机、手机等图像获取设备获得场景图像,然后通过计算机将图像场景还原,由此形成了一门新的学科——计算机视觉。随着时代的发展,各行各业的信息化程度在逐步提高,使用三维模型展示目标对象或场景结构的需求越来越大,如何逼真、简洁的通过计算机重建三维模型成为计算机视觉的研究方向之一。上世纪80年代以来,应用激光扫描技术对场景扫描,采集场景的点云信息并重建三维模型的方法得到广泛应用,但三维扫描设备成本高昂,采集范围不大,不能满足大场景三维重建的需求。随着计算机视觉技术的发展,从二维图像的像素信息中提取相关几何信息的研究不断发展,基于多视图的三维重建方法为三维重建提供了新途径。

运动恢复结构(SfM)是一种从一组2D图像估计场景的3D结构的过程。人类通过它来感知有关环境中三维结构的大量信息,当观察者移动或者观察者周围的物体移动时,从随时间感测的图像获得立体信息。可靠的运动恢复结构算法在地球科学、文化遗产保护、机器人视觉导航、地图生成、航空勘测、目标识别以及计算机图形学中的虚拟现实等领域都有很好的应用价值。

SfM是重建的第一步,以图像集合作为输入,经过一系列估计算法,输出场景结构(即三维点云)和相机轨迹(即相机位姿的集合)。SfM主要的方法有两种:增量式重建和全局式重建。增量式重建精度高、重建方法具有很好的健壮性,但是有三个缺陷:其一,重建结果依赖于初始图像对的选取;其二,需要不断对场景中大量的参数进行迭代,重建速度较慢;其三,误差会随着图像的增加不断累积,累计到一定程度会出现场景漂移,也就是如果场景本身是闭环的话,重建结果因为累积的误差无法闭环。全局式重建将增量式重建中出现的误差或者互相抵消,或者均分到整个场景,可以有效避免无法闭环的问题。同时,由于全局式重建没有初始图像对的依赖问题,而且只需要迭代优化少量的几次就能收敛,所以速度较快。但是,全局式重建本身的方法导致了它的优点也是它的缺点,由于误差均分和迭代次数少导致精度不高,而精度无法通过简单的增加迭代次数就能提升。2017年提出的混合式SfM(Hybird SfM,HSfM)结合了增量式重建和全局式重建的优点,并克服了它们的缺点,取得了很好的重建效果。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

人类通过四处移动来感知环境中三维结构的大量信息。当观察者移动并且观察者周围的物体移动时,从随时间感测的图像获得信息。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

第1-4周:查阅相关文献资料,明确研究内容,了解研究所需理论基础。确定方案,完成开题报告。

第5-6周:熟悉掌握基本理论,完成英文资料的翻译,熟悉相关工具软件的使用。

第7-9周:研究增量式重建和全局式重建流程及其相关技术。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1] 袁艺军. 基于无序图像集的运动恢复结构研究与实现[D].浙江大学,2018.

[2] Moulon P , Monasse P , Marlet R .Global Fusion of Relative Motions for Robust, Accurate and Scalable Structurefrom Motion[C]// IEEE International Conference on Computer Vision. IEEEComputer Society, 2013.

[3] Cui H , Gao X , Shen S , et al. HSfM:Hybrid Structure-from-Motion[C]// 2017 IEEE Conference on Computer Vision andPattern Recognition (CVPR). IEEE Computer Society, 2017.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。