基于TensorFlow的验证码图像信息提取实现开题报告

 2022-10-25 09:46:16

1. 研究目的与意义

验证码曾经作为一种安全手段, 被广泛应用于互联网领域。

它可以用来防御机器程序的自动批量注册、发垃圾广告等行为。

本课题主要设计实现一个基于TensorFlow的验证码图像信息提取程序。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 课题关键问题和重难点

课题的关键有那么几个:首先获取足够的验证码样本,可以是数字或字母组成的比较规则;然后切割验证码,把验证码切割成四个部分并对它们进行预分类;最后批量将切割并保存好的图像提取特征值,将得到的图片进行二值化处理,变成像素值保存。

第一个困难应该是来自TensorFlow ,第一次使用,会有编程范式的变化,因为 TensorFlow 是声明式开发方式,通过 Session 真正执行程序,这和常见的开发语言编程范式不太一样。

第二个应该是在生成验证码图像的时候,我们不能将图像分成四个相同大小的块,因为验证码会将这些字母或数字随机放置在不同的水平位置: 在图像处理中有事会发现有的验证码之间是相互连起来的,这个时候就需要另外的方法可以提取到单个的字母或者数字。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 国内外研究现状(文献综述)

字符识别能大大提高信息的采集录入速度,减轻人们的工作强度。

随着计算机技术的飞速发展,字符识别技术多年来不断改进和完善,现在已经广泛应用于各个领域,使大量的文档资料能快速、方便、省时省力和及时地自动输入计算机,实现信息处理的电子化。

到目前为止,尽管人们在字符识别的研究中已取得很多可喜成就,但还不能满足我们日常的需求。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究方案

1、搭建开发环境python3.5 pycharm.2、获取足够的验证码样本,可以使用一个验证码生成脚本生成.3、验证码清理并生成训练集样本,首先读取该文件路径下的所有图片文件名称,对图片进行粗处理,将其转换为灰度图像,再进行图像细清理,完成后进行单字符图像切割,切割完成后保存到训练集.4、对每一个切割出后的单个字符进行特征提取得到的图片进行二值化处理,变成像素值,然后保存在文件夹下.5、进行模型训练,可以改善它的预测正确率.6、读取训练好的模型,对特征向量进行识别得到预测结果,然后将识别出来的字符结果串起来,输出结果文件.

5. 工作计划

1-2周:在确定选题之后,上网查阅文献以及相关资料,对选题进行理解,知道题目的选题背景需求以及目的.3-5周:完成外文翻译、开题报告;通过网络对外文文献中出现的各种专业术语进行理解,并以此为依据搜索后面所需要的国内与题目有关文章,为论文的撰写提供保障,详细了解课题任务内容,对课题需求做出判断。

6-8周:开始进行验证码图像信息的工作,获取的足够的验证码样本后开始对样本进行一系列的处理,使它可以顺利的被提取并输出;9周:完成模型训练,可以顺利运行并得到结论,以便中期检查;10-11周:继续优化验证码提取,查看是否会出现问题,确定符合实验要求;撰写论文;12-13周:实验大致完成,最后重新检查实验中存在的细节问题,保证数据的准确性和真实性14-15周:完成毕业论文设计和成果总结,回顾整个阶段所出现的问题以及解决的方法,做好总结,准备好答辩前所需的材料和展示内容。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。