基于深度学习网络的手写数字识别算法与实现毕业论文
2020-04-11 17:57:27
摘 要
手写数字在现实生活中应用非常广泛,随着科学技术的发展,手写数字识别也成为了光学符号识别和模式识别领域研究的重要课题。深度学习的神经网络模型是目前机器学习领域中研究的热门话题,已经在图像识别,语音识别等多个领域中有了很广泛的应用,使用深度学习的神经网络模型进行手写数字识别的研究发展有重要的意义。
论文主要研究了使用深度学习的卷积神经网络模型实现手写数字识别,利用卷积神经网络所特有的稀疏连接、权值共享、池采样特性,从原始数字图像中提取样本的特征信息,作为神经网络的输入,能有效减小特征,缩小神经网络的输入,从而达到高效率的手写数字识别。
在本次设计中,采用MINST数据集中的手写数字图片作为原始数据,输入数据之后,通过设计的包含有卷积层和下采样层的卷积神经网络,对原始手写数字数据进行训练和测试,得到手写数字识别率,与传统的手写数字识别方法相比,减少了预处理的工作量,提高了手写数字识别的效率,但是需要大量的样本做为输入。
关键词:深度学习;卷积神经网络;手写数字识别
Abstract
Handwritten numbers are widely used in real life. With the development of science and technology. Handwritten numeral recognition has also become an important research topic in the field of optical symbol recognition and pattern recognition. Deep learning neural network model is a hot topic in the field of machine learning. It has been widely applied in many fields, such as image recognition, speech recognition, and so on. The research and development of deep learning neural network model for handwritten numeral recognition is of great significance.
The paper mainly studies the recognition of handwritten numerals using the convolution neural network model using deep learning. Using the characteristic of sparse connection, weight sharing and pool sampling characteristic of the convolution neural network, the feature information of the sample is extracted from the original digital image. As the input of the neural network, the feature can be reduced effectively and the nerve can be reduced. Network input, so as to achieve efficient handwritten numeral recognition.
In this design, the handwritten digital picture of MINST data set is used as the original data. After the input data, the original handwritten digital data is trained and tested through the design of the convolution neural network containing the coiling layer and the lower sampling layer, and the recognition rate of handwritten numerals is obtained. It reduces the workload of preprocessing, improves the efficiency of handwritten digit recognition, but requires a large number of samples as input.
Key Words:Deep learning;convolutional neural network;Handwritten digit recognition
目录
第1章 绪论 1
1.1 研究背景及意义 1
1.2 国内外研究现状 2
1.3 论文设计内容和组织结构 3
1.3.1 系统设计流程 3
1.3.2论文章节内容安排 4
第2章 手写数字识别网络对比 5
2.1 人工神经网络 7
2.1.1 人工神经网络简介 7
2.1.2 人工神经网络模型 7
2.2 BP神经网络 7
2.2.1 BP神经网络搭建前期操作 8
2.2.2 BP 神经网络的搭建 9
第3章 卷积神经网络设计 11
3.1卷积神经网络的特性 11
3.1.1 稀疏连接 12
3.1.2 池采样 13
3.1.3 权值共享 13
3.2 卷积神经网络层次设计 13
3.2.1 输入层与输出层的设计 13
3.2.2 卷积层 14
3.2.3下采样层 15
3.2.4全连接层 16
3.3 隐层的设计 17
3.3.1 选择激活函数 17
3.3.2 卷积层的设计 17
3.4 网络总体结构 18
第4章 实验结果分析 19
4.1 MNIST数据集介绍 19
4.2 实验设计过程 20
4.2.1 程序运行环境 20
4.2.2 实验结果分析 21
4.3 实验结果分析 22
第5章 总结与展望 25
5.1 本次设计工作总结 25
5.2展望 25
参考文献 26
第1章 绪论
手写数字识别是属于OCR(光学字符识别技术)的一类分支,它通过计算机来实现自动识别手写数字,。手写数字识别就是将图片上的0到9总共十个数字进行分类识别,它也属于图像识别问题。
手写数字识别的一般流程如图1.1所示。
图1.1 手写数字识别流程
1.1 研究背景及意义
手写数字在生活中使用的地方很多,只有从零到九十个符号, 在邮局根据邮政编码进行邮件分拣,银行的各种票据流通,国家的大规模人口普查,学校成绩单的录入,各种付款单,支票,企业年检的报表,还有很多财务、税务、金融等大规模的数据统计中都有用到。
深度学习是人工智能领域的最新的热点。它解决了人工智能多年来没有获得进展的问题。深度学习的简单理解就是使用机器模仿人类学习的动作,完成一些需要大量重复动作完成的工作,即让机器完成为人所做的工作。为了达到这种目的,使机器仿照人类如何完成学习与思考记忆,人类大脑完成这些动作是需要大脑的组织实现,模拟这种庞大而又复杂结构构建一种可以在机器中使用的网络结构。到现在,已经研究出了很多种可以运用到生活工作中的网络模型,不仅有监督学习类型的网络,还有各种无监督学习类型以及半监督类型的神经网络,依据各种神经网络模型的特点被应用于不同的领域,发挥它们的作用。神经网络的结构很复杂,对于大量的数据处理有着很多其他方式不具备的优点,在许多需要处理大量数据的领域被广泛的应用。深度学习在语音识别,图像识别这些领域应用已经非常普遍,在原来的识别技术上有很大的改进,深度学习在解决很多实际的问题方面,已经超过了传统多层神经网络的内涵。
使用计算机实现手写体数字的识别,能够减轻大量的手动工作量,从而节约时间,降低成本,这不仅是科学技术的进步,还会带动经济的发展,产生巨大的社会经济效益。阿拉伯数字是被世界通用的符号,所以世界各地的手写数字研究几乎不含有地域文化的交流冲突,研究工作者们可以跨地域在同一平台上开展相关的工作,能更多的对研究进展进行比较,探讨,非常方便,但是手写数字的书写简单,每个数字的相似度也比较高,而且由于个人书写习惯的不同,手写数字的识别也有很大的难度。深度学习的神经网络模型是近年来机器学习领域研究的热门话题,它在图像处理,语音处理等方面应用非常广泛,使用深度学习的神经网络模型研究手写数字识别,提高手写数字识别效率,有很重要的现实意义。
1.2 国内外研究现状
手写数字识别目前的研究在很早的时候就存在了,应用的方式有所不同,识别的方法也存在差别。根据区别,相关研究有结构和统计这两种类型。随着计算机的相关软硬件和理论的发展,人们对这一问题的研究又研究并采用了很多新的方法和手段。
对于手写数字识别的方法有很多种,手写数字识别研究中提到国内外的手写数字识别方法有两类:基于几何形体结构特征识别算法、基于BP神经网络统计特征识别算法。在孔洞、端点、交叉点灯特征识别的基础上,研究发现了一些更优秀的识别方法,比如区域骨架,离心率等等,用于查找所要识别区域的特征,这些新的研究成果对于问题的解决有更好的效果。
使用卷积神经网络完成小样本图像识别,在原始的小数据集中引入数据增强变换,扩充样本,将大规模数据小样本化等等改进,实验之后得出这种方法对于小规模图像数据集的识别中有更好的准确率[1]。为了提高使用BP神经网络实现识别手写数字的正确性以及网络的训练效果,对此网络的分类器做了许多方面的修改,主要的修改方向有代价函数,权值初始化,正则方法等部分,通过研究修改设计完成对BP算法的优化工作[2]。陈玄等人提出一种融合卷积神经网络模型,这种模型中结合暹罗网络模型和二进制卷积神经网络模型对卷积神经网络进行改进,更好的实现手写数字识别[3][9]。刘方园介绍了卷积神经网络深度模型的发展,并对其内部结构对应的操作详细的阐述分析,对卷积神经网络在语音识别、遥感图像分类等领域的具体应用[4]。张庆辉等人针对卷积神经网络层数及参数的问题进行了优化分析,做出了很多改进,提高了识别的速度和准确率[5]。卷积神经网络对于车辆标识识别,交通标志识别,图像分类和目标检测应用这些图像的识别中都取得了很好的效果[6][7][8]。卷积神经网络对人脸识别,手写数字的识别和车牌识别这些领域也取得了很好的成绩[10][11][12]。
对于MNIST数据集合与主成分分析以及方向梯度直方图相联系,使用自编码网络实现特征再次提取,而后对模型在进行分类操作。张翠芳对使用优先度排序神经网络完成对手写数字的识别操作进行了研究,主要的研究部分在于输入的图像数据,对于输入的图像做多种类型的线性变换,经过多种形式的导数变换,还有噪声的干扰效果等等,通过对这些部分的研究分析和对比,找出最合适的数字识别系统。完成对神经网络的优化工作。根据研究噪声、稀疏、权值对称等多种自编码神经网络的原理,以及改良之后的自编码神经网络在手写数字识别过程中设置各种参数的取值,关注它在图像特征表达的效果,证明使用该网络对手写数字进行识别能够提高效率。为了提高手写数字的识别准确率,将雅克比正则项和稀疏约束项加入到自动编码机中,提出了雅克比稀疏自动编码机算法,使用这种算法进行手写数字识别,对数据中包含的隐藏结构有效提取,而且可以通过描述数据点的边缘特征,实现自动编码器算法学习能力的提高。在BP神经网络的基础上,对于搭建网络结构中可能存在的干扰因素,进行分析研究,发现搭建的网络模型中的问题,做出相应的修改,并加以完善, 最终构建了更加完整的神经网络。Yang W引入一种端到端的系统DeepWriterID,使用卷积神经网络,改进了系统,提高了识别率[13]。LeCun Y, Bengio Y, Hinton G对深度学习的原理和应用做了很详细的介绍,很适合深度学习的入门者学习[14]。Konstantinos Zagoris提出利用视觉文字包模型实现手写数字识别的方法,得到了良好的识别效[15]。
1.3 论文设计内容和组织结构
系统使用MATLAB2010b环境进行设计,选用公开数据集MINST手写数字数据作为本次设计的数据来源,完成手写数字识别的设计。
1.3.1 系统设计流程
使用卷积神经网络模型实现手写数字识别系统中需要的层次有输入层,卷积层,采样层,全连接层,输出层。图1.2设计所用结构
图1.2 设计所用结构
- 输入层:本次设计需要实现手写数字识别,所以输入层的输入数据识别的手写数字图像。
- 卷积层:使用卷积核乘以图片上的像素所对应的权重,提取图像中不同位置的特征,对于图像的识别,需要用到多个特征,而每个卷积核 只能提取出一个特征,所以需要使用多个卷积核对图像进行操作,得到最终需要的图像特征。
- 下采样层:在卷积神经网络中也被叫做池化层,在这层对图片的操作与卷积层相似,不同的是下采样层对卷积核的操作是在对应的位置上取最大或平均值,也被叫做最大池化或平均池化。
- 全连接层:全连接层的作用和分类器的作用类似,起到将学习的内容标记在样本空间的作用。它可以使用卷积操作实现。
- 输出层:可以使用函数对输出数据进行分类,比如softmax回归函数。
本次设计卷积神经网络含有,输入层、输出层,卷积层和下采样层各两个,总共六层实现对MNIST数据集的手写数字的识别和验证。
1.3.2论文章节内容安排
论文整体结构
第一章主要介绍基于神经网络的手写数字识别算法的研究背景和意义,对手写数字国内外分研究现状做了简单的了解,并安排了设计的工作内容和论文的章节内容。
以上是毕业论文大纲或资料介绍,该课题完整毕业论文、开题报告、任务书、程序设计、图纸设计等资料请添加微信获取,微信号:bysjorg。
相关图片展示:
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。