基于MATLAB的语音信号特征提取系统的设计

 2022-10-16 11:50:17

论文总字数:19017字

摘 要

随着计算机技术和人工智能的发展,语音识别也渐渐出现在大众的眼前。由于社会趋势的潜在要求,以及人工智能的崛起,在此后的发展中语音识别技术仍将发挥重大作用。其中语音信号特征的提取最重要,语音信号特征的提取是进行语音信号识别的关键。

本文介绍了语音信号的特征、采集与分析方法,以及对语音信号的频域和时域分析,同时还要避免噪声的干扰,用到Matlab软件,采用HTK实验包来实现对语音信号的提取,并在采集语音信号后,采用隐马尔科夫模型(Hidden Markov Model, HMM)进行训练和识别,从而实现了基于Matlab的语音信号特征提取系统的分析。

最后对本文进行了总结。为了准确的提取到语音信号,运用合适的端点检测方法,基于短时平均能量等,通过构建HTK工具包和Matlab的仿真结果,来解决这个问题。

关键词: 语音识别;噪声干扰;隐马尔可夫模型;端点检测

Design of Language Signal Feature Extraction System

Abstract

With the development of computer technology and artificial intelligence, speech recognition has gradually appeared in front of the public. Due to the potential requirements of social trends and the rise of artificial intelligence, speech recognition technology will still play an important role in the future development. Among them, the extraction of speech signal features is the most important, and the extraction of speech signal features is the key to speech recognition.

Therefore, this paper briefly introduces the features, acquisition and analysis methods of speech signals, as well as the frequency and time domain analysis of speech signals. At the same time, to avoid the interference of noise, we use MATLAB software and HTK experimental package to realize the extraction of speech signals. After the acquisition of speech signals, we use hidden Markov model to train and recognize, so as to judge whether the feature extraction is positive or not. True.

Finally, this paper summarizes. In order to extract speech signal accurately, the problem is solved by constructing HTK toolkit and MATLAB simulation results using appropriate endpoint detection method based on short-term average energy.

Keywords: speech recognition; noise interference; hidden Markov model; endpoint detection

目录

摘要 I

Abstract II

第一章 绪论 1

1.1语言识别系统的研究现状 1

1.2 语音识别系统的研究意义 1

第二章 语音信号分析 3

2.1语音信号数字化和预处理 3

2.2语音信号的时域分析 4

2.2.1短时能量分析 4

2.2.2短时自相关函数和短时平均幅度差函数 5

2.2.3语音端点检测 5

2.3语音信号的频域分析 5

2.3.1滤波器组法 5

2.3.2傅立叶频谱分析 5

第三章 语音识别主要算法 7

3.1动态时间伸缩算法 7

3.2隐马尔可夫方法 7

3.2.1HMM的基本理论和数学描述 7

3.2.2 HMM的三个基本问题及解决算法 8

3.2.3 HMM的结构和类型 9

第四章 语音识别算法的实现 11

4.1隐马尔可夫模型算法在Matlab中的实现 11

4.1.1端点检测 11

4.1.2训练和识别 11

4.2实验结论分析 12

第五章 总结和展望 14

5.1设计总结 14

5.2展望 14

致谢 15

参考文献 16

附录 16

第一章 绪论

1.1语言识别系统的研究现状

谈到语音识别时,有必要提到传奇的贝尔实验室。1952年,戴维斯和来自贝尔研究所的其他人,成功研究了第一个可以识别10个英语字母发音的语音识别系统[1]。早期的语音识别系统很容易识别单个单词。

自1960年左右开始,AI大师Reddy开始进行语音识别研究。丹尼斯等人在英国成功开发出第一个使用计算机的语音识别系统。但在此期间,语音识别技术的发展非常缓慢,贝尔实验室的约翰皮尔斯写了一封信将语音识别研究与“将水转化为汽油,从海中提取黄金”进行比较。因为当时几乎不可能获得黄金,可见,在当时对语音识别系统的研究很困难[2]

大约在1980年,语音识别得到了迅速发展。隐马尔可夫模型(HMM)的理论和应用以及NGRAM语言模型的应用是两项关键技术。研究的重点逐渐从孤立词识别系统转向大型词汇和独立于说话人的连续语音识别系统。例如,李开复开发的斯芬克斯系统是第一个基于统计原理的独立于说话人的连续语音识别系统[6]。回顾过去一年中语音识别的发展,CNN绝对是一个关键词,许多公司在这方面投入了大量的研究[9]。其实CNN已经在语音识别中用了很长时间,2012、2013年的时候Ossama Abdul-Hamid就将CNN引入到语音识别中。当时,卷积层Pooling层交替出现,卷积层的规模相对较大。同时有线电视新闻网层数不太高,它主要用于处理相对特性,以便更好地使用它们。随着有线电视新闻网在图像领域的蓬勃发展,VGGNet、GoogleNet和ResNet的应用为有线电视新闻网提供了更多的语音识别的思路,如多层卷积后的连接Pooling 层,缩小卷积层的尺寸,可以使我们研究得更深,使CNN模型取得更好的效果[13]

1.2 语音识别系统的研究意义  

剩余内容已隐藏,请支付后下载全文,论文总字数:19017字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;