论文总字数:16457字
摘 要
这些年来在我们的周围的生活里,声音识别方法因为它的特有的的准确、方便、经济等优势被越来越多的人所应用,并越来越成为我们生活中不可或缺的一部分。声音识别系统的功用就是从许多声音信号中自动提取人们的所说的话,并提取其中的信息,再对声音信号分析并提取其特征,辨别收到的声音是否在已知的声音集合中,通过识别收到的声音辨别出所说的话。这次的设计就是基于隐马尔可夫模型(HMM)技术的声音事件识别的方法。基于声音识别技术的基本原理,并对其进行了初步研究。设计并实现了一个有少量语音的声音识别系统。通过MATLAB软件,设计基于隐马尔可夫模型的训练程序和识别程序,识别个别人的声音。此声音识别系统分为预处理模块、特征提取模块、练习模块和辨别模块。
关键词: 声音识别;隐马尔可夫模型;MATLAB;特征提取;练习
Research on sound event recognition method based on Hidden Markov model
Abstract
Over the years, in our life around us, voice recognition method has been applied by more and more people because of its unique advantages of accuracy, convenience and economy, and has increasingly become an indispensable part of our life. The function of voice recognition system is to automatically extract what people say from many sound signals, and extract the information, and then analyze and extract the characteristics of the sound signal, to identify whether the received sound is in the known sound set, and to identify what is said by identifying the received sound. This design is based on Hidden Markov model (HMM) technology of sound event recognition method. Based on the basic principle of voice recognition technology, and its preliminary study. A voice recognition system with a small amount of speech is designed and implemented. Through MATLAB, the training program and recognition program based on Hidden Markov model are designed to recognize individual voice. The voice recognition system is divided into preprocessing module, feature extraction module, practice module and identification module.
Key words: Voiceprint recognition; HMM model; MATLAB; feature extraction; training
目 录
摘 要 I
Abstract I
第一章 绪 论 1
1.1声音识别背景 1
1.2声音识别系统的分类 1
1.3声音识别的发展前景 1
1.3.1声音识别的发展 1
1.3.2声音识别技术的研究现状 2
1.4本论文内容安排 2
1.5小结
第二章 声音识别基本原理和方法 3
2.1 预处理 3
2.2 特征选取 3
2.3 MEL倒谱参数 4
2.4 模式匹配 5
2.5小结
第三章 隐马尔可夫的基本介绍 5
3.1隐马尔可夫基本原理 6
3.1.1 Markov链 6
3.1.2 隐马尔可夫基本概念 7
3.2 隐马尔可夫基本算法 7
3.2.1 前向-后向算法 7
3.2.2 Viterbi算法 8
3.2.3 Baum-Welch 算法 9
3.3小结
第四章 系统实现和实验结果 10
4.1系统实现 10
4.2语音库的构成 12
4.2.1语音库 12
4.2.2语音库的安排说明 13
4.3实验结果 13
4.3.1 TI测试 13
4.3.2 TD测试 14
4.4小结
第五章 总结 15
5.1实验总结 15
致谢 16
参考文献 17
附录 18
第一章 绪 论
1.1声音识别背景
声音识别可以自动分辨声音,通过声音信息自动识别人的过程。声音识别重点在于声音信号中的特有的特征性信息,相当于人的个性特征,再提取收集到的声音信息中的所含有的全部个人特征信息,进而分辨出个人特有的声音信息【1】。
语音信息有两种常规的特性。因为每个人的声道不同,天生的嗓音不同,这便使我们可以通过采集声音信息数据,分析声音信息,使得分辨出声音来源人的个性特征成为可能。我们收集声音信息来分辨人们的个性特征有着许许多多的好处,语音是人的一种固有的个性特征,不同的人有不同的声音信息特点;语音的采集十分方便,研究的成本比骄低;电话和网络也可以为我们所用,发展远程的服务项目。因为如今的技术随着时代的发展越来越成熟,声音识别被更加广泛的应用,为各行各业发挥了极大的促进的作用。最常见的一些应用就有很多,比如关键关口门口的人身份识别,识别可以通过的人的信息身份,并且还可以识别一些在逃罪犯及一些相要检测的人的身份信息识别,支付宝的声音支付和京东及微信的电子支付还有手机的声音身份识别等等。更有一些在军事方面的重要应用,比如对重要人物的身份识别、禁止或允许通行人员的身份识别,还包括地面、天空及水下的战场环境检测。所以,我们可以认为声音识别不仅在现在有着许许多多非常重要的应用,而且在未来还将有更多更加重要及广泛的应用。
1.2声音识别系统的分类
(1)按照要识别的文本分类
声音识别系统对于收集的语音可以分为两类。一类是和文本无关,是对无规定的声音信息进行分辨;另一类是和文本有关,是规定的声音信息进行分辨。我们一般采用相同的词汇系统,规范化的进行识别以及处理信息,再将其表格词汇进行整体化的识别及信息处理,这是和文本有关的识别。可相对于和文本无关的声音信息,我们一般应用不同的表格进行分辨处理。这是因为和文本有关的声音信息声音的内容比较固定,对于它的研究比较普遍,所以比较容易分辨处里。但是和文本无关的声音信息比较简单,这样不仅识别度变低,而且不是很容易有人对其进行仿制,这样的声音信息的研究已经成为了如今研究的重点方面内容。
剩余内容已隐藏,请支付后下载全文,论文总字数:16457字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;