1. 研究目的与意义
随着经济和科学技术水平的不断提高与发展,大量的文字信息出现在人们的生活之中,如街道上随处可见的指示牌信息、往来行使车辆上的车牌号信息、生活中各种不同物品上的标识信息以及工作中经常处理的文本信息等等。
为了适应科技时代发展的趋势和优化人类的日常生活方式,实现对各类文字信息的自动检测、存储和识别等过程快速而准确的执行就显得尤为重要,大量的科研工作者对其进行深入的研究,进而推动了光学字符识别(Optical Character Recognition, OCR)技术的产生与发展。
OCR 的发展起源可以追溯到 19 世纪初,直到 1928 年,该技术才被首次正式提出。
2. 课题关键问题和重难点
手写数字识别的性能指标有两种:正确识别率和识别速度,在实际应用中,要考虑的因素还有很多,系统的复杂性,系统的价格等等,这些对于识别都会存在一定的影响。
由于对于识别还没有为以确定的标准,所以对于识别来说,要想达到精准的识别效果还是存在很大难度。
数字类别只有10钟,书写简单,识别容易,但是在实际研究中识别率却不高,主要有以下几种原因:1)公开的数据集的数量仍然不足,不能涵盖所有人的手写习惯,由于收集和提取存在问题,导致最终的数据集存在大量异常数据。
3. 国内外研究现状(文献综述)
数字是人们每天都会接触到的,其使用量也是最大的,手写数字在信息交流过程中是必不可少的并且被广泛应用,为了缓解人工操作压力,有效地实现应用计算机完成对手写数字进行识别的方法必不可少,光学字符识别技术自从提出以来,就引起了很多学者的关注。
到目前为止,手写体数字识别技术在国内外已经取得了不错的研究成果,但是其识别效果并不能达到100%。
因此,该项研究还是很有必要很值得进行深入研究的。
4. 研究方案
本课题研究手写数字识别,实现对各类文字信息的自动检测、存储和识别等过程快速而准确的执行就显得尤为重要,针对这个现状,我有以下的方案。
前几周,采用调查研究法,文献参考法,经验总结法等,阅读文献收集数据并完成报告。
接下来,预处理技术实现中,平滑去躁采用模板操作的方法,进二值化时采用全局阈值法或者动态阈值法,归一化分为位置归一化和大小归一化,对图像进行倾斜校正时根据数字连通区域的几何特征进行特征提取,提出出来的特征进行直线拟合,根据所变现出来的直线进行校正,图像细化。
5. 工作计划
第1-4周:阅读老师指定的文献和自己查阅的文献,并在以后作为参考,撰写开题报告,收集所需数据,完成一篇外文翻译,并且完成毕设论文的第一章绪论部分。
第5~8周:①预处理技术的实现。
预处理技术是手写数字识别系统中很关键的一步,与处理的结果直接影响到特征向量的抽取,环环相扣,其中包括平滑去躁,进二值化、归一化、对图像进行倾斜校正、图像细化等技术。
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。