商业医保发票字符识别系统的单字识别模块的设计与实现

 2022-02-06 19:06:43

论文总字数:23432字

摘 要

由于计算机科学的不断推进,计算机科学已经与经济范畴的各类问题越发紧密地联系起来。图像处理和模式识别是计算机科学中两个非常重要的技术,将两者与医保发票的识别结合起来,可以提高医保发票审批的工作效率。本文整理和研究了国内外字符识别的方法和特点,提出了基于卷积神经网络的字符识别方法。卷积神经网络是人工神经网络的变形,它是将人工神经网络和深度学习结合在一起提出的。卷积神经网络具有局部感知,共享权值和空间子采样的结构特点,在识别图像的应用上表现优异的性能。本文的主要工作有:

(1)根据商业发票的字符特点,设计和实现了印刷体字符数据集生成的模块。生成的数据集是不同字符的不同变换的印刷体图片,包含常用汉字、英文字母(含大小写)、标点符号和特殊符号。数据集包含了三类不同的样本集合,分别用于训练、验证、测试的过程。每类样本集包含两个文件:图像文件和标记文件,总共有六个文件。其中,每个图像文件存储了对应样本集中所有样本的图像像素信息,每个标记文件中,对应图像样本集中每个图像样本,存储了其标记的数值。

(2)在完成上述的工作后,参考卷积神经网络经典模型LeNet-5的网络结构,设计和实现了不包含输入层的6层卷积神经网络,网络的输入层对应分辨率大小为32*32的图像,输出为与分类标签逐一匹配的多维向量。在MNIST数据集和自己生成的数据集上做了识别率的验证,达到了接近100%的识别正确率。

关键词:字符识别,卷积神经网络,发票

DESIGN AND IMPLEMENTATION OF CHARACTER RECOGNITION MODULE IN COMMERCIAL MEDICARE INVOICE RECOGNITION SYSTEM

Abstract

Due to the continuous progress of computer science, computer science has become more closely linked to the various problems of economic categories. Image processing and pattern recognition are two important computer technology. Combining them can identify the character of medicare invoice. In this paper, character recognition methods at home and abroad are collected and studied by the writer. Character recognition method based on convolutional neural network are also proposed. Convolutional neural network is a modification of the artificial neural network, which is the combination of artificial neural network and deep learning. It has three features: local connected, shared weights and spatial sub-sampling, which shows excellent performance in image recognition. The main work of this paper are:

(1) According to the characteristics of the character of the commercial invoice, the writer design and implement the printed character data set generation module. Generated data sets are printed image of different characters in different transformations. There are commonly used Chinese characters, English letters (including capitalization), punctuation and special symbols. Data set contains three different set of samples that are used for training, verification, testing process. Each class sample set consists of two files: the image file and label files. The total number of all files is six. Wherein each image file stores corresponding sample set of all samples image pixel information for each label file. each label file samples stores label values of corresponding images in image files.

(2) After the completion of the work, with reference to the classical convolution neural network model LeNet-5, the writer design and implement 6-layer convolutional neural network in addition to the input layer. The input layer of the network is corresponding to an image, the size of which is 32*32. The output layer is corresponding to a vector of the classification label. On MNIST data sets and own data sets, we reach nearly 100% recognition accuracy.

Keywords: character recognition , convolution neural network model , invoice

目录

摘要 I

Abstract II

第一章 绪论 1

1.1研究背景以及意义 1

1.2 国内外研究现状 1

1.3 本文的主要工作 3

第二章 卷积神经网络概述 4

2.1 卷积神经网络的特点 4

2.2 卷积神经网络整体结构 4

2.3 卷积神经网络注意事项 6

2.3.1 数据集的大小和分块 6

2.3.2 数据预处理 6

2.3.3 数据归一化 6

2.3.4 网络权值初始化 6

2.3.5 学习速率 6

2.3.6 收敛条件 6

2.3.7 误差函数的选择 6

第三章 基于卷积神经网络的单字符识别设计与实现 7

3.1 数据集介绍 7

3.1.1 数据集的生成过程 7

3.1.2 数据集的存储格式 9

3.1.3 数据集的读取过程 11

3.2单字符识别模型的设计 12

3.2.1 卷积神经网络结构的设计 12

3.2.2输入层和输出层的设计 13

3.2.3中间层的设计 13

3.3 实验过程和结果分析 15

3.3.1 实验过程 15

3.3.2 实验结果分析 16

第四章 总结与展望 19

4.1本文的主要内容和总结 19

4.2存在的问题 19

4.3对未来工作的展望 20

参考文献 21

致谢 22

第一章 绪论

1.1研究背景以及意义

随着医保在全国的推行,参保人员医疗过程中产生的各种单据需要送到医保机构进行报销。传统的医保单据报销审批全程手工处理,工作效率不高,人力需求量比较大,出错率也比较高。另外,报销后单据的搜索、检查十分不容易。由于手工分割,单据分类不明确,对后面单据的统计、分析、管理也非常不利。由于计算机科学的不断推进,计算机科学已经与经济范畴的各类问题越发紧密的联系起来。图像处理和模式识别是计算机科学中两个非常重要的技术,将两者与医保发票的识别结合起来,可以改变现存的医保发票报销审批过程纯手工的情况,提高医保发票审批的工作效率。所以本文提出设计和实现商业医保发票智能识别系统。发票智能识别系统利用图像处理技术将发票的内容和文字转换成计算机可处理的代码格式,取代传统人工输入的方法。然后采用模式分类中的光学字符识别(OCR)技术识别发票中的内容。发票智能识别系统提供了比传统手工发票处理准确率更高,效果更好,速度更快,安全性更好的发票处理模式。

医保发票都是打印而成的,发票上打印的内容包含常用汉字,数字,标点符号,英文字母等。英文字母有26个不同的字符,需要考虑英文字母的大写和小写,共有52个独立的字符。常用的中文汉字数目大约为3500多个,如果再包含不同的字体等,类别数量远远大于英文字母、标点符号等字符的类别数量,另外汉字具有非常复杂的结构,汉字之间还存在着很多的相似字,所以汉字的识别难度也远远大于标点符号、数字、英文字母的识别。识别印刷体的字符是智能发票识别的核心所在,也是智能发票识别的难点之一。而字符识别包含的汉字字符又是识别的关键点和难点。所以本论文设计和实现的单字符识别模型,具有非常大的研究价值和实际意义。

1.2 国内外研究现状

光学字符识别(OCR)是模式分类研究的一个很重要的方面,解决字符识别的问题需要依赖不同范畴的多种技术,例如图像处理、机器学习等等[1]。模式识别的研究是从十九世纪五十年代开始的,光学字符识别(OCR)是模式分类中一个最受关注的研究内容[6]。在国际上,美国和日本最先开始了光学字符识别的研究,并且也取得了一定的研究成果,苏联,德国、英国、澳大利亚等国家都有光学字符识别机的研究和生产[1]。从二十世纪七十年代开始,我国进入了研究汉字识别技术的阶段,到现在大约三十多年的历史。无论是国内还是国外,光学字符识别的研究都已经发展到一定的水平,并且进入了应用的阶段。

剩余内容已隐藏,请支付后下载全文,论文总字数:23432字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;