搜索详情-毕业论文网

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回

基于朴素贝叶斯的手写汉字识别毕业论文

 2020-04-15 17:34:44  

摘 要

汉字图像识别技术作为模式识别理论的一个重要研究方向,主要应用于办公自动化和文本信息处理,除了印刷体汉字识别系统外,目前更多的研究集中在手写体汉字识别。汉字识别属于模式识别中的超多类分类问题,未知样本的分类是通过已知样本的分类及其特征来确定的。例如,手写毛笔字的识别就是一个小样本条件下的分类问题。

在汉字识别中,通常特征选择方法有网格特征、外轮廓特征、方向线素特征等,本文采用的是网格特征。常见的分类算法有基于概率统计的贝叶斯分类、模板匹配分类器、神经网络分类器等,本文采用的是二值贝叶斯分类器。本文以贝叶斯分类算法为基础,在Matlab2017b开发环境中设计了一个小样本手写毛笔书法字识别系统。该系统采用20*5的模板对图像分成100块提取手写毛笔书法字体的100个特征,在二值图像数据的基础上,通过朴素贝叶斯分类器算法对小样本中文汉字进行学习和分类识别。

关键词:图像分类 朴素贝叶斯 手写体毛笔书法字 模式识别

Research on image recognition of handwritten chinese character

Abstract

Chinese character recognition is an important field of pattern recognition application, which is mainly used in automation and information processing. In addition to the printed text recognition system, more research now focuses on handwritten character recognition. Character recognition belongs to the classification problem in pattern recognition, that is, the classification of several known samples and the classification of unknown samples are determined by their characteristics.

In Chinese character recognition, the usual feature selection methods include grid feature, outer contour feature, direction line element feature, etc. Common classification algorithms include bayesian classifier based on probability and statistics, template matching classifier , artificial neural network,, etc. In this paper, binary bayesian classifier is adopted. Based on naive bayes classifier algorithm and naive bayes classification decision algorithm, a character recognition system of handwriting brush with small sample was designed in Matlab2017b development environment. This system uses 20*5 templates to divide the image into 100 blocks and extract 100 features of handwriting brush fonts. On the basis of binary image data, the naive bayesian classifier algorithm is used to learn and classify Chinese characters in small samples.

Keywords:Image classification;naive Bayesian;handwritten brush calligraphy image;Pattern recognition

目录

手写汉字图像识别研究 I

摘 要 I

Abstract II

第一章 绪论 1

1.1研究背景 1

1.2研究意义 2

1.3手写体汉字识别可能遇到的困难与研究现状 3

1.4本文研究计划 5

1.5本文章节安排 5

第二章 手写汉字的识别方法 7

2.1贝叶斯分类法 7

2.2支持向量机 9

2.3笔画特征模式分类 11

2.4本章小结 13

第三章 毛笔字识别 14

3.1手写体汉字识别过程 14

3.2样本库设计 15

3.3特征选择与提取 17

3.4特征提取程序设计 18

3.5本章小结 19

第四章 贝叶斯分类器设计 20

4.1贝叶斯公式 20

4.1.1朴素贝叶斯分类方法 20

4.1.2文字识别中的贝叶斯公式 21

4.1.3识别系统界面 23

4.2实验结果与分析 24

4.3本章小结 24

第五章 总结与展望 25

参考文献 27

致谢 30

绪论

1.1研究背景

在计算机技术高速发展的21世纪,为提升日常工作效率,使用计算机对各类形式的文本进行输入已成为一种趋势。汉语作为全世界使用人数最多的语言之一,我国绝大部分的文献资料都是使用汉字记录的,如何将汉字文献准确快速的输入进计算机内,这一直以来是困扰着中国人的一个难题。

随着模式识别技术的发展,如今直接将汉字以整体图像送入计算机进行读取主要发展出了两种方法:一种方法为使用者在手写板或触摸屏之类的外设上写字,通过记录笔触,运笔力度及方向等信息进行识别,由于保留了大部分写字时的信息,所以这种方法称为联机识别,另一种方法是脱机识别,即使用扫描仪等设备将现成的图像扫描识别并进行读取。在脱机识别中,主要可分为印刷体汉字识别和对手写汉字的识别。

手写汉字识别是指用计算机自动地识别出写在介质上的手写汉字,它是计算机的智能接口,也是手写汉字高效输入计算机的重要手段[1]。手写汉字识别技术的发展不但有利于解决当前汉字文本输入不够快速的困境,还使得计算机在某些方面能成为人们在生活工作中的左膀右臂,例如近几年在中小学流行的拍照解题软件、物流公司的快递实时分拣系统、办公室里的文档转换工具等等。除此以外,将中文 OCR(光学字符识别 Optical Character Recognition)系统与语音合成系统结合,还能够形成自动阅读机或盲人阅读机[2]。

随着高校与各大企业研究院正对汉字识别技术进行深入探索,目前已研制出多种成效优良的联机汉字识别系统并投入市场使用,但对于脱机手写体汉字识别系统的开发却始终不够成熟有效,这一点需要广大学者继续研究与探索。同时,也从侧面表明了对脱机手写体汉字的研究在当前市场具有远大应用前景。

以上是毕业论文大纲或资料介绍,该课题完整毕业论文、开题报告、任务书、程序设计、图纸设计等资料请添加微信获取,微信号:bysjorg。

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。