基于MATLAB的语音信号识别系统

 2023-08-07 10:02:23

论文总字数:26748字

摘 要

语音识别的目的主要是是让各种各样的机器能听懂人的语言,换句话说就是在任何情况下,都能准确地识别出人类说话的内容。语音识别技术既是国际竞争的一项重要技术,也是每一个国家经济发展不可缺少的重要技术支撑。本设计从时间和频率两个角度对语音信号产生的数学模型进行分析,系统地阐述了语音识别的基本概念。借助Matlab软件中图形编写界面GUI,实现了一个可以实时录音并进行语音识别的系统。所选择的模型是隐马尔科夫模型(HMM) ,语音特征参数主要选择MEL频率倒谱系数,设计了从数字0到数字9的语音识别系统。该系统可靠性高,实时性好,正确率高。

关键词:语音识别,Matlab,隐马尔科夫模型,GUI

Abstract:Speech Recognition is designed to allow machines to understand what people say,and accurately identify the contents of voice. Speech recognition technology is not only an important internationally competed technology,but also an indispensable foundational technology for the national economic development.Based on the mathematical model from the speech signal,this paper analyze audio signal from the time domain,frequency domain proceeding,and discussed the basic theory of speech recognition technology.Five algorithm are discussed:Dynamic Time Warping(DTW)、Rule-based Artificial Intelligence,Artificial Neural Network(ANN),Hidden Markov Model(HMM),HMM combined with ANN.Speech recognition algorithm is realized in various programs,this article taking the method is to use Matlab powerful mathematical operation ability to realize the recognition of speech signal isolation.. We can characterize the sound with key parameters such as intensity, frequency etc. In this paper, Markov model (HMM) recognition algorithm using MFCC (MEL frequency cepstral coefficients) as the main voice characteristic from 0 to 9 parameters, the establishment of a Chinese digital speech recognition system. This system credible,timable and high accuracy.

Key words:Speech recognition algorithm,Matlab,HMM model, GUI

目 录

1 前言 4

1.2 语音识别系统的基本构成 4

2 语音信号分析 4

2.1 语音学基本知识 4

2.1.1 音素和音节 4

2.1.2 语音信号产生模型 5

2.2 声音信号的数字化和预处理 5

2.2.1 数字化 5

2.2.2 信号的预加重处理 6

2.3 语音信号的时域分析 6

2.3.1 短时能量分析 6

2.3.2 短时平均过零率 8

2.4 语音信号的频域分析 8

3 基于Matlab环境下的语音识别算法分析 10

3.1 语音端点检测 11

3.2 特征参数提取 12

3.2.1 LPCC倒谱系数 12

3.2.2 MFCC倒谱系数 12

3.3 训练和识别 13

4 基于Matlab环境下图形编写界面GUI的实现 13

4.1 函数关系 13

4.2 操作步骤及设计思路 14

5 语音识别实现过程 16

结论 20

参考文献 21

附录A:主要程序程序代码 23

附录B:GUI程序代码 26

1 前言

1.1 语音信号识别的发展史

早在计算机出现之前,让机器能听得懂人说话的想法就已经被提上了日程,例如最早出现的声码器就可以看做是语音识别的先例。在后来的语音识别技术的演进中,对语者的判定研究出现在1930年。中国的语音识别研究起始于1958年,到1973年才开始利用计算机进行单个的语音识别,但是由于当时条件不足,无法进一步深入研究。到了1980年以后,随着科学的飞速发展,语音识别技术也越来越引起重视,其中连续的两个或三个词语的语音识别技术也日益强大起来,成为当时的热点话题,引得各个机构的人才不断的开发各种优化算法,其中最具典型的是动态语音识别算法,该算法已被应用到很多领域。

1.2 语音识别系统的基本构成

语音信号识别系统是由接收端、处理端,和输出端构成,接收端的主要功能是接收语音信号,处理端预处理的步骤一般有五个:预滤波、AD转换、端点检测、加窗处理、预加重和去加重等。进行过这五个步骤以后,下面就是进行提取特性参数。所提取的参数要求满足以下几点条件:1、参数之间要相互独立,避免重复或者出现干扰2、特性参数要便于计算机处理,计算起来方便快捷,以确保实时性。3、所选择的特性参数能代表语音的主要特性,方便区分它们。

语音识别系统由两个部分组成,第一部分是训练阶段,主要功能是处理接收端的语音信号,提取特性参数,并把所得到的模型保存为VQ模版库。第二部分是识别阶段,对输入进来的语音信号分析处理,识别出其中的内容。

2 语音信号分析

2.1 语音学基本知识

在单个的汉字信号辨认中,只需对单一的汉字进行特征参数提取即可。而在连续的两个或三个汉字信号辨认中,为了不断提高辨认的正确率,必须更进一步研究汉字语音信号,例如对各个汉字的声调,汉语的音素和音节的特性等。

2.1.1 音素和音节

剩余内容已隐藏,请支付后下载全文,论文总字数:26748字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;