基于人工神经网络模型的声纹识别方法的研究

 2023-02-05 23:40:54

论文总字数:16318字

摘 要

声纹识别方法是用来确认是什么生物发出的声音,也就是说这是一种从一段语音信息中识别出是谁发出声音的历程。因为其非常方便、成本低、应用广阔的优势,声纹识别在很多范畴具备广泛的利用前景。

人工神经网络是由一连串简略且高度互联的处理单位构成,这种信息处理单位共同完成信息处理的工作。一个处理单元通常仅是对其全部输入进行的加权求和,所有计算结果是神经网络达到了某种平衡条件时的整体状态。

本论文主要研究:1、声纹识别的特点及其发展意义;2、声纹识别的特征参数选用的研究;3、研究几种声纹识别方法的特点;4、研究基于ANN 的声纹识别方法以及系统实现;

【关键词】:声纹识别、人工神经网络、LPC倒谱系数

RESEARCH ON THE VOICEPRINT RECOGNITION

BASED ON ANN

Abstract

The voiceprint recognition method is used to confirm what kind of organism sounds, that is to say, it is a process of identifying who made a voice from a voice message. Because of its very convenient, low cost and wide application, voiceprint recognition has a wide range of applications in many areas.

Artificial neural networks consist of a series of simple and highly interconnected processing units that together perform information processing. A processing unit usually only performs a weighted summation of all its inputs, and all calculation results are the overall state when the neural network reaches some equilibrium condition.

This paper meanly focus on:1. The characteristics of voiceprint recognition and its development significance;2. Research on the selection of feature parameters of voiceprint recognition;3. Research on the characteristics of several voiceprint recognition methods;4. Research on voiceprint recognition based on ANN.

【Keywords】: voiceprint recognition, artificial neural network, LPC cepstrum coefficient

目 录

摘 要 I

Abstract II

第一章 绪 论 1

1.1 研究背景与意义 1

1.2声纹识别的国内外研究现状 2

1.3 声纹识别技术应用前景展望 2

第二章 声纹识别中特征参数的选取 4

2.1 声纹识别中的语音信号处理 4

2.2 特征参量评价方法 4

2.3 特征参数的选取 5

2.4 线性预测倒谱系数 5

2.4.1 线性预测分析 5

2.4.2 LPCC求解 6

2.5 差分特征 7

2.6 本章小结 7

第三章 声纹识别的方法与特点 9

3.1 矢量量化模型(VQ) 9

3.2 支持向量机模型(SVM) 9

3.3 隐马尔可夫模型(HMM) 10

3.4 高斯混合模型(GMM) 10

3.5 本章小结 11

第四章 基于ANN 的声纹识别方法以及系统实现 12

4.1 人工神经网络原理 12

4.2 人工神经网络的特点 13

4.3 神经网络结构与学习算法 13

4.3.1 网络结构 13

4.3.2 学习算法 15

4.4 语音信号的基音周期实验 17

4.5 实验与分析 22

4.6 本章小结 22

第五章 结束语 23

致 谢 24

参考文献 25

第一章 绪 论

1.1 研究背景与意义

当今时代,经济发展越来越快速,与此同时信息学和生物学也在以惊人的速度成长,网络和计算机技术也在更多的领域内被普及。人类身份的识别对便利程度、信息化、和保密程度的要求有加无已。以往的身份识别手段基本是从人员和身份信息识别着手的,其主要通过加密手段来完成,拥有很多不足之处,如果被其他人获取的互联网账号密码会使其取得当事人用户的权力。对个人信息的保密性形成严重威胁。是以,这种认证手段已难以满足现今要求的高安全性及持久安全性,而近年来开辟的生物认证手段正以一种更方便,更安全,更隐秘的信息安全技术开始在身份识别范畴的逐渐占据上风。

因为其独特性,高稳定性和高便捷性,生物识别技术在现今信息安全和人机交互技术的快速成长中具有广博的利用远景:一是因为其高度的安全性和独特性,使其在涉及国家机密方面的系统保密性要求较高,领域发展较快; 其次,倚仗其方便性和独特性,使其智能化的应用于社会化范畴。

声纹识别又称说话人识别,是生物认证技术的一种,声纹识别是通过分析一个或多个声音信号的特征来实现的,以达到辨认未知声音的目的。 简而言之,就是要区分某个句话是否是某个人所说的技术。

声纹识别与其他很多的生物识别技术有很多的相似性,尤其是在安全的角度来考虑,并且收集声音的设备成本非常低,只需要mobile phone和话筒就可完成。它不会涉及到隐私,同样的也不会与说话的内容产生联系,对于大部分的人来说,声纹识别都可以适用。

声纹特点的提取是在真实的情况中实施的。情况的复杂性包含声纹识别的说话者和客观的生活状况。作为说话者,即便是同一个人,即便收集到的两个语音内容一致,但由于语速、情感、疲劳程度等缘由,语音声学特点也不可避免地具备成长和变异性,在不同时期或特殊情况下,每种声音都会有些许不同。如果想要能够准确的完成目的,我们必须正确的面对这一挑战而不是逃避。

如今的市场形势中,采用了声纹识别技术的产品并未得到普遍利用。原因并不是声纹识别的发展不够完善,而是因为现实生活中其可以使用的环境并不简单,会出现个人信息辨别的结果出现错误的可能。 虽然相关技术可以用来过滤杂音,但这仅仅是相对而言的。外界的噪声极可能会致使误判。因此,大部分应用了声纹识别技术的产品只适合比较清静的场所,但是商场、地铁、医院等人类集合之地则不大适合。

根据要完成的工作不同,声纹识别可以分为说话人辨认和说话人确认两种类型。按照要辨别的一段声音所包含的不一致,声纹识别又分为与文本有关和与文本无关两种手段。图1-1为其关系示意图。

剩余内容已隐藏,请支付后下载全文,论文总字数:16318字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;