论文总字数:23675字
摘 要
在语音信号处理中,语音端点检测 (voice activity detection, VAD)的含义是在一段包含语音的信号中,准确地确定语音的起始点和终止点,将语音段和非语音段区分开[1]。
本文首先总结了语音信号的发展概述,分析了常用的几种端点检测方法,介绍了本次实验所用的软件工具MATLAB的发展、版本类型、应用领域。其次介绍了语音信号的一些基本概念,本文主要介绍了短时能量、短时平均幅度、短时过零率、短时自相关函数、倒谱分析、小波变换并阐述了这些方法的理论分析,随后利用仿真软件MATLAB对四种方法进行了仿真分析。实验一进行的是双门限法的仿真实验。用短时平均能量找出韵母,短时平均过零率找出声母,这样也就找出了完整的一个汉语音节[2]。再用双门限法两次比较阈值,找出语音信号的端点。实验二 自相关法端点检测。自相关函数最大值法核心就是利用了噪声信号和含噪语音的自相关函数存在巨大的差异。实验三 谱熵法。这种方法主要利用的是语音信号的熵和噪声的熵存在巨大的差异,通过检测谱的平坦程度,最终实现语音信号端点的检测。实验四 对数频谱距离的端点检测。这种方法主要研究的是在许多语音增强程序中会自带一个vad检测函数,它的作用是在语音增强前便进行端点检测,把有话帧和噪声帧分开进行处理分析。
文章最后对仿真实验所用的四种方法进行了总结,对实验方法的心得及对端点检测未来的展望方向。
关键词:语音端点检测;短时能量;短时平均过零率;谱熵法
Research On Method Of Voice Activity Detection
Abstract
In speech signal processing, voice activity detection (VAD) means to accurately determine the starting and ending points of a speech in a speech signal, and to distinguish speech segments from non-speech segments.
This paper firstly summarizes the development of voice signal, analyzes several commonly used endpoint detection methods, and introduces the development, version type and application field of the software tool MATLAB used in this experiment.Secondly introduces some basic concepts of speech signals, the commonly used several methods currently used for speech signal endpoint detection.A two-threshold method for speech endpoint detection is proposed.In this way, a complete Chinese syllable is found, and then the threshold value is compared twice with the double-threshold method to find the endpoint of the speech signal.Experiment 2: endpoint detection by autocorrelation method.The core of the maximum value method of autocorrelation function is that there is a huge difference between the autocorrelation function of noisy signal and noisy speech.Experimental three-spectral entropy method.Experiment 4: endpoint detection of logarithmic spectrum distance. Its function is to perform endpoint detection before speech enhancement and separate the speech frame and noise frame for processing and analysis.
Finally, the paper summarizes the four methods used in the simulation experiment, points out the problems encountered in the experimental research, the experience of the experimental methods and the future prospect of endpoint detection.
Keywords: Voice Activity Detection , Short-time Energy , Short-time Mean Zero-crossing rate
目 录
摘 要 I
Abstract II
第一章 绪论 1
1.1 语音信号的发展概述 1
1.2 当前语音端点处理的常见方法 1
1.3 开发工具Matlab2018的介绍 2
1.3.1 MATLAB发展 2
1.3.2 MATLAB主要版本 2
1.3.3 MATLAB应用 3
1.3.4 MATLAB特点 3
第二章 语音信号的基础知识 4
2.1 语音识别系统 4
2.2 语音的产生及数字模型 4
2.2.1 语音发音系统 4
2.2.2 语音信号的数字模型 4
2.3 语音的概念与参数 5
2.3.1 声强和声强级 5
2.3.2 响度 5
2.3.3 音高 6
2.4 语音信号的预处理 6
2.4.1 语音信号的预加重处理 6
2.4.2 语音信号的加窗处理 7
第三章 语音信号的短时时域分析处理技术 8
3.1 短时能量和短时平均幅度 8
3.2 短时过零率 9
3.3 短时自相关函数 9
3.3.1 自相关函数 9
3.3.2 短时自相关函数 10
3.4 倒谱分析 10
3.5 小波变换 10
第四章 实验及分析 12
4.1 双门限法端点检测 12
4.2 自相关法端点检测 13
4.3 谱熵法端点检测 14
4.4 对数频谱距离的端点检测 15
4.4.1 对数频谱距离的基本原理 16
4.4.2 对数频谱距离的计算 16
4.4.3 实验结果 16
第五章 总结与展望 17
致 谢 18
参考文献(Refernces) 19
附 录 21
剩余内容已隐藏,请支付后下载全文,论文总字数:23675字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;