全文总字数:5747字
1. 研究目的与意义(文献综述)
1.1 研究目的及意义
视觉是人类最重要的感知系统,是人类获取信息最重要的渠道。在当前信息化时代的背景之下,计算机如何辅助人类完成视觉任务,解决人类在进行场景内目标信息的采集和处理任务时的不足,是人类一直探索的方向,计算机视觉也因此成为当今社会的研究热点。
目标检测作为计算机视觉领域的核心问题之一,学术界已有将近二十年的研究历史,其主要任务是找出图像或视频序列中感兴趣的物体,确定其类别、位置和边框范围。目标检测的实现综合运用了图像处理、机器学习、深度学习和人工智能等技术,有广泛的应用前景。
2. 研究的基本内容与方案
2.1 研究的基本内容和目标
本课题拟实现一种深度学习算法,利用现有深度学习框架,在公开数据集上完成对特定图像的目标检测,找出图像中感兴趣的物体,确定其类别、位置和边框范围。在学习研究深度学习和Faster R-CNN的基本原理的基础上,熟练运用相关知识完成基于Tensorflow
框架相应网络的设计,训练基于COCO数据集的Faster R-CNN神经网络,并实现图像中特定目标的检测。
3. 研究计划与安排
(1)第1-4周:查阅相关文献资料,明确研究内容,了解研究所需理论基础。确定方案,完成开题报告。
(2)第5-6周:熟悉掌握基本理论,完成英文资料的翻译,熟悉相关工具软件的使用。
(3)第7-9周: 实现Faster R-CNN神经网络的设计与实现
4. 参考文献(12篇以上)
[1] Jiang H, Learned-Miller E. Face Detection with the Faster R-CNN[C]. IEEE International Conference on Automatic Face Gesture Recognition. 2017.
[2] Ren S, He K, Girshick R, et al. Faster R-CNN: towards real-time object detection with region proposal networks[C]. International Conference on Neural Information Processing Systems. 2015.
[3]He K,Zhang X,Ren S,et al. Spatial pyramid pooling in deep convolutional networks for visual recognition[C]. European Conference on Computer Vision.Springer,Cham,2014:346-361
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。