基于高斯混合模型的声纹识别方法的研究

 2023-02-05 23:40:51

论文总字数:17006字

摘 要

声纹识别是依据人类的出声原理和行为特点能够自动辨别出出声人的身份的一种生物识别方法。语音是我们人类交际沟通过程中非常重要的方式。并且科技也是我们社会高速发展的重要组成部分。声纹识别对高科技的发展有着重要的作用。比如我们手机的语音Siri功能就是根据这个原理来设计完成的。声纹识别有着巨大的开发潜力。目前来说,声纹识别对安全验证有着很大的作用,它既可以解决人们在普通密码验证时忘记密码的尴尬,也能提供一定的安全性,并不是所有人都能准确的模仿出别人的声纹。

至今为止,实现声纹方式的模型有很多种。本论文主要介绍基于高斯混合模型(GMM)的声纹识别方法的研究。之所以选择高斯混合模型,是因为它有一定的优异性。在我们进行声纹识别时,可以将这个模型拆分成多个高斯来进行组合,可以研究各种各样不同的情况下声纹的概率。

关键词:高斯混合模型;声纹识别;特征提取

Abstract

Voice pattern recognition is a biometric method that can automatically identify a person"s identity according to the sound principle and behavior characteristics of human beings. Speech is a very important way in our communication. And technology is also an important part of the rapid development of our society. Voice pattern recognition plays an important role in the development of high technology. For example, the Siri function of our mobile phone is designed according to this principle. Voice print recognition has great potential for development. Currently, voiceprint recognition has a great effect on security verification, it can solve the people forget password embarrassment when ordinary password authentication, can also provide a certain amount of security, not everyone can accurately mimic other people"s voice print.

So far, there are many models to realize the voice pattern. This paper mainly introduces the research of the acoustic pattern recognition method based on gaussian mixture model (GMM). The gaussian mixture model is chosen because it has certain excellency. When we do voice print recognition, this model can be broken up into multiple gaussian combinations, which can be used to study the probability of sound patterns in a variety of different situations.

Keywords: gaussian mixture model; Voice pattern recognition; Feature extraction

目录

摘要 I

Abstract II

目录 III

第一章 绪论 1

1.1声纹识别的背景与意义 1

1.2 声纹识别的研究现状 1

1.3 本论文的主要内容结构 2

第二章 语音信号分析与处理 3

2.1 语音信号的产生 3

2.2语音信号的数学模型 3

2.3语音信号的数字化 4

2.4语音信号的预处理 4

第三章 特征参量分析与提取 7

3.1常用的特征语音参数 7

3.1.1特征参量评价方法 7

3.1.2语音信号的时域分析 7

3.2 LPC倒谱参数 8

第四章 基于GMM的声纹识别系统 12

4.1贝叶斯估计理论 12

4.1.1贝叶斯基本内容 12

4.1.2MAP估计 13

4.1.3ML估计 13

4.1.4EM算法 14

4.2高斯混和模型(GMM) 14

4.3GMM的模型 14

4.3.1GMM模型的基本概念 14

4.3.2GMM模型的参数估计 15

4.3.3GMM模型的识别问题 15

4.3.4GMM识别方法的优化 16

第五章 声纹识别系统 18

5.1引言 18

5.2语音数据库 18

5.2.1构建语音样本 18

5.2.2两种识别率计算方法 19

5.3实验结果及讨论 19

5.4实验的改进之处 21

致谢 22

参考文献 23

绪论

1.1声纹识别的背景与意义

声纹识别最早起源于20世纪40年代末,bell实验室研究出来的。很早的时候用在军方事项分析上。我们国家大约在50年代后期开始研究声纹识别。美国在60年代末后期,将该技术用在了法医鉴定、法庭证据等领域。从那时候起到现在,美国很多犯罪案件都运用声纹识别技术提供了可靠的线索和证据。到90年代前期,它的价值被很多大公司所发掘如苹果、IBM、NNT等,他们消耗了了大量的人力,物力,财力在这方面的研究上,并取得了一定的成果。比如现在苹果的Siri做的已经非常成熟。我国在执行863计划后,声纹识别技术的也紧追上了别的国家的步伐。我们国家在汉字识别上取得了很好的识别率,直逼国际先进水平。声纹识别的研究涉及到了许多的领域,如语言方面的采集和处理,人工智能方面的融合,计算机的识别程序代码方面等等。很多我们国家的各大高校实验室都进行了有关方面的研究,其中具有代表性的研究单位为清华大学电子工程系与中科院自动化研究所模式识别国家重点实验室。

声纹识别在技术上可以简单的说成两种。一个是确认,一个是辨别。前者就是用于确认这个发出语音的人是不是系统中某个被标记好的人,总的来说就叫说话人确认技术;后者叫说话人辩论技术是用来辨认未知讲话人是记录中的哪一个人。说话人确认技术通常用于银行方面的交易,公安机构的取证,电脑和汽车的声控锁,证券方面的交易以及身份证和信用卡的识别等。说话人辨认技术通常用于公安和法律收集证据。

由于网络和科技的高速发展,我们对身份识别越来越严格,要求也越来越多。传统的密码验证已经不足以满足现在网络信息技术的需求,存在越来越多的漏洞。而生物特征识别技术越来越成熟,比起最初的密码验证有着巨大的优越性。声纹识别即是此中一个生物特征辨认的有效的身份识别。由于每个人的音色和音调各不相同,所以声纹识别一个人的身份有一定的可靠性。由于语音的采集不需要一些复杂精密的仪器,只需要麦克风即可,所以这种识别有一定的方便性,而且它也不涉及隐私。

1.2 声纹识别的研究现状

由于经济和科技的飞速发展,声纹识别的研究发展得愈来愈普遍声纹识别的专题每年都会出现在一些有关信号、声音的会议论坛中。可以说声纹识别的研究已经步入到我们的各种生活环节中。下面简单的介绍以下两个声纹识别的研究方向:

剩余内容已隐藏,请支付后下载全文,论文总字数:17006字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;