论文总字数：18209字

目录

一、绪论 1

1.1研究背景及理论意义 1

1.2识别系统性能的评价 1

1.3研究现状 2

1.4本文的研究工作 2

二、数字识别算法 4

2.1基于BP神经网络的识别算法 4

2.2基于结构特征的识别算法 6

2.2.1 Rapid变换系数法 6

2.2.2图像的不变性特征量提取 6

2.2.3方向统计特征量的提取 7

三、手写体数字识别 7

3.1方案设计 7

3.2提取数字 8

3.2.1图像预处理 9

3.2.2数字分离提取 9

3.3识别数字 10

3.3.1细化 10

3.3.2统一规格化 11

3.3.3再细化 11

3.3.4特征提取 11

3.3.5知识库构建 12

3.3.6模板匹配 13

3.4小结 13

四、全文总结与展望 15

参考文献 16

致谢 18

一、绪论

1.1研究背景及理论意义

当今社会，全球经济一体化使得阿拉伯数字这一表示财富的字符无时无刻的不出现在身边。当然，数字并不只能用来表示财富，我们生活中每天都要接触运用大量的数字，例如身份证号码、发票数据、数学数字等。不妨设想，如果我们能够运用信息自动化的手段，通过机器去识别处理每天接触的海量的数字信息，社会将节省大量的人力物力，生产活动的效率将大大提高。

除了具有很高的实际应用前景，手写体数字识别在其对应的领域中同样是一个需要研究的方向，也存在巨大的科研价值：

(1) 数字是世界通用的字符。数字不同于各国的语言文字，它是基本上独立于文化背景的，这就为各国和各地区的有想法的研究人员提供了一个很好的舞台。在手写体数字识别方向，我们通过探索、比较，对各种方向进行研究。

(2) 对于自由书写的数字字符，机器识别还难以达到很高的识别精度，手写体数字识别在未来一段时间仍会是一个有难度的开放问题。

(3) 手写体数字识别算法可以普遍应用到其他应用上，比如在手写英文字符的识别应用上。

1.2识别系统性能的评价

如果我们想要对某物进行识别，我们需要使用一些参数来评估系统的性能，本文的研究对象也是是如此。评价内容既要借鉴文本识别的普遍做法，又要利用数字识别的特点完善内容。

对于手写数字识别系统，我们能通过三个参数来体现系统的性能：

准确的识别率CR =准确的样本数/总样本数 (1.1)

替代率(错误率)WR =错误样本数/总样本数 (1.2)

拒绝率RR =拒绝样本数/总样本数 (1.3)

三者的关系是： CR WR RR =100%

数字识别领域中，科学家经常在意的一个参数是“识别精度”，就是能在全部识别的字符中，剔除拒绝识别的字符后，准确识别的字符所占的百分比，由此规定了识别的准确度

P =CR / (CR WR ) *100% (1.4)

系统想要更加精准应是RR、WR非常小，P、CR很大。拒绝率RR的提高大多数情况下往往可以使错误率WR下降，那么同时，识别率CR和识别准确度P就会随之提高。所以，要评估一个手写体数字识别系统，科学家一定要总体注意几个参数。除此之外，因为在实际生活中，手写数字形式多样，变体众多，所以就一定要明白一个参数是在什么样的样本集合下提取到的。

总而言之，评价数字识别系统的性能，我们需要再特定的指标下进行。针对不同书写模式和环境情况而设计的数字识别系统，我们不能放在一起简单评价。不过，我们可以确定的是，一个优秀的能应用于实际生产生活的手写数字识别系统，识别率CR一定很高，而误视率WR将会极小。

1.3研究现状

参考资料[1]提出基于BP网络的识别方法。先要提前处理，如数字字符分割、细化等，产生数字样品，继续用采取的样本用于训练BP网络，然后通过较完善的BP网络识别没有接受训练的数字样品，最终数字的识别率可升至百分之95以上。参考资料[2]中，应用了一种全新的手写数字识别算法，该创造性在结构分析的基础上达到了较好的识别能力。通过上述算法，搭配预处理模块、识别模块等其他，创造了一个基于线下的手写数据表格识别系统，并且在实验中获得了不错的效果。参考资料[3]讲了手写体数字识别的背景、理论作用和难点，描述了手写体数字识别的基本内容和实际效果，并猜想了手写体数字识别技术的未来发展。参考资料[4]全面地讲了MATLAB图像处理工具箱的知识，包括其中各种图像处理中的手段、小波变换和图像几何等。参考资料[5]介绍了一种全新的特征向量的实现方法，能实现多个矢量的产生；并提出了对机械图纸上的印刷数字字符快速识别的算法，在测试中取得较好效果。参考资料[6]提出一种新的印刷体数字字符高速识别算法，利用图像旋转、去噪、分割等方法进行预处理，通过利用印刷体数字的结构特点量化四种比较精确的结构特征，再依据所量化的数据构造编码器。通过实验我们可以发现，该高速、高准确度的算法抵抗一部分干扰。参考资料[ 7 ]提出了基于BP神经网络的染色体识别与统计、车牌定位与字符识别、字符识别等几组实验流程步骤。实验是通过MATLAB编程实现的。参考资料[8]讨论了一个自由手写体数字识别系统的设计与实现，通过对数字图像一系列的预处理，然后在如何提取数字字符的结构笔划特征方面进行方案研究，并说明了知识库的创建方法，并且利用了依托知识库的模板匹配方法，并通过利用MATLAB实现了这一系统。实验发现，该方案包含较高的识别率和更好的对噪声的免疫力。参考资料[9]利用了MATLAB 各神经网络模型，细致地介绍了各模型的结构、原理及相关算法。

1.4本文的研究工作

本文研究的是基于数字字符结构特征的手写数字识别系统设计。我们已经了解，数字识别是字符识别的一类，与字符识别不同的，实际生活中我们对数字识别的单字字符识别的正确率要求非常高，近乎低于1 / 1000甚至1/10000的错误率，因为数字识别常常设计到财务和金融方面，这样高的准确率要求也就不难理解。因此，能够应用到实际的数字识别系统的设计难度不言而喻。

在本文的第二章数字识别算法中，我们详细地说明了数字识别的原理方法和技术难点。通过一系列的图像处理步骤和对数字的结构特征的提取，最终以量化标准去匹配字符模板来进行数字字符的识别。同时，一些数字形状差异不大（例如：手写的3和8），这让准确区分某些数字有很大的困难。就现在来说，在数字识别算法领域，有两种比较经典的算法：一种是利用BP神经网络的识别算法，另外一种是利用结构特征的识别算法。基于BP神经网络的识别算法可以通过大量的样本训练最终达到识别未经训练的手写数字样本；基于结构特征的识别算法的关键是提取数量少而信息量大的结构特征。

最后，本文提出了一种新的基于9个特征矢量的数字识别算法，并以识别学生成绩单中的数字为实例进行算法实现演示。该算法系统分为两个主要步骤：数字提取和数字识别。数字提取，先对数字图像进行一系列的预处理，包括图像二值化、平滑滤波、连通域切割等图像处理方法，最终将分割开的单个数字字符存储在不同的文件里；数字识别，仍要对已提取的数字字符图像进行预处理，包括去噪、形态学细化、归一化、再细化等操作，而后提取9个特征矢量，它们是：三条横线和三条竖线分别与数字边线的交点数，左右两条对角线和数字边线的交点数，数字的端点数。量化后的特征结构与已经构建的知识库进行匹配，与知识库中数字匹配距离最小的就可能是最后的识别数字。

二、数字识别算法

数字只有十个，笔画很简单，看起来识别问题不是很难。但在应用中，许多结果表明，手写数字识别的准确的识别率很多时候还比不上印刷体汉字的识别率，甚至比不上在线手写汉字的识别率高，也仅优于手写汉字识别。分析后，我们总结出其主要原因是：一些数字形状差异不大（例如：手写的3和8），这让准确区分某些数字有很大的困难；其次，虽然只有十个数字，笔画简单，但数字书写的方式非常多，一个手写数字识别系统很难充分兼顾世界上各式各样的数字手写体。此外，在日常生活中，对数字识别的考虑要比文字识别高得多。这是因为在数字中没有语境，每一个数字字符的识别都很重要，而数字识别往往涉及到财会，财务领域的严密性不言而喻。因此，用户的要求不仅仅是较高的准确率，而是近乎低于1 / 1000甚至1/10000的错误率。此外，大量的数据处理对系统速度有相当苛刻的条件，大部分算法理论是比较准确的，但代价是非常低的处理速度。

根据长期的一些研究，我们可以发现，对于没有限制的自由书写的数字，没有一个单一的算法可以达到很好的识别精度。因此，新的设计导向是研究更加成熟、复杂、综合的算法系统。

2.1基于BP神经网络的识别算法

BP（Back propagation）网络是由David Rumelhart和James Mcelelland在《Parallel Distributed Processing》一书首先提出。BP网络是一种基于误差逆向传播算法训练的前馈神经网络，被广泛应用于模式识别、函数逼近、分类、数据压缩这四大方面。BP 网络的设计主要包括输入层、隐含层、输出层和层间传递函数等。BP 网络示意图如图 2.1 所示。