基于小波变换的语音信号消噪方法

 2022-01-18 00:05:59

论文总字数:18491字

目 录

1 引言 1

1.1语音去噪的研究背景和意义 1

1.2语音去噪的发展历史和研究现状 1

1.3论文的研究内容 2

2语音信号处理的方法 3

2.1常见的信号分析方法及比较 3

2.1.1傅里叶变换 3

2.1.2短时傅里叶变换 4

2.1.3小波变换 5

2.1.4三种变换的比较 5

2.2小波变换的基本理论 5

2.2.1小波变换 5

2.2.2连续小波变换 6

2.2.3离散小波变换 6

2.2.4二进小波变换 7

2.2.5小波的多分辨率分析 7

2.3基于小波变换的语音信号处理 8

3基于小波变换的语音去噪方法 8

3.1小波去噪的基本原理 9

3.2小波去噪的方法 9

3.4四种常见的阈值选取规则 13

3.5小波去噪的传统阈值处理函数 14

3.6一种优化的阈值函数 15

3.7小波去噪的性能去噪标准 15

4实验仿真及结果分析 16

4.1语音采集 17

4.2添加噪声 17

4.3语音分离 17

4.4语音去噪 17

4.5实验结果分析及小结 22

5总结与展望 22

参考文献: 24

致 谢 25

基于小波变换的语音信号消噪方法

许欢

,China

Abstract: In order to achieve the de-noising of the voice signal, improve the clarity and intelligibility of the speech signal. In this paper, we first compare several common signal processing methods and choose the method of wavelet transform to perform speech denoising. And then the method of wavelet denoising is used to denoise by threshold method. Then, based on the study of the speech denoising method based on wavelet transform, a new threshold method is proposed to solve the shortcomings of the traditional soft and hard threshold function. At the same time,we researched the selection of the wavelet basis function and the threshold Determine the rules. Finally, through the simulation experiment, the comparison method and the objective evaluation data of traditional threshold processing are used to verify the superiority of the method.

Key Words:speech denoising; wavelet transform; threshold function

1 引言

1.1语音去噪的研究背景和意义

语言作为当今社会最主要也是最直接的交流方式,它自然准确,方便高效。随着科学技术在社会生活中的应用越来越广泛,各种电子通信技术加速融入人类的社会文化交流中,当今社会正迅速迈入一个信息全球化的时代。与此同时,各式各样的电子产品参与进了人类的生产以及生活活动之中,人机交互的地位显得愈发重要,作为人类最重要的交流工具,语音信号处理技术也得到迅速的发展。

然而在过去一段时间内,尽管计算机技术在过去一段时间内得到比较明显的发展,使语音信号处理技术获得较为显著的发展并且使其成为一种比较常见的人机交互技术,各种性能优越的的语音识别系统也不断出现在人们的视野中。但是,我们通常将这些语音识别系统放在不含噪音的安静的环境下进行性能优劣的评测,而如果测试的环境含有噪音的话,语音识别系统的性能会受到比较严重的影响,甚至会出现无法识别的情况。人们在使用语言方式进行交流过程中,总是在有意无意之间会受到来自周围所处环境各种各样的影响,同样,在语音信号采集时也会受到各种各样的噪声的影响。噪声的来源非常广泛,例如在工业生产,交通运输以及广告宣传中都会产生各种不同的噪声,甚至在一些通讯设备的内部也会产生噪声,如通信电缆产生的噪声、集成电路的电子噪声等。

噪声的存在会使干扰信号通过通信网络和我们的语音一起传输,降低语音信号的清晰度和语音信号的质量,使获得的语音信号达不到理想的效果。噪声还会影响一些语音系统(语音增强系统、识别系统、编码系统等)的正常工作,严重的甚至导致系统瘫痪。因此,为了减少语音信号采集过程中噪声带来的影响,语音去噪是一件非常必要的工程。而且,语音信号处理作为一个实用性与综合性很强新兴学科,具有很高研究前景,并且随着信息化时代的发展,语音技术愈发与社会生活接轨,研究语音技术对于科研技术和社会发展都有着重要意义。

1.2语音去噪的发展历史和研究现状

20世纪50年代,基于Z变换和采样数据理论,实现了低频地震信号的数字处理。但由于当时技术条件、成本、实时性限制其开发速度,导致数字信号处理的效果远远低于模拟信号处理的效果。而后随着快速傅里叶变换(FFT)的出现,使数字信号处理技术成为一门科学应用学科,并逐步向实用型技术迈进。 在20世纪60年代前后,数字信号处理被开发和应用于许多领域。 Lira和Oppenheim在1978年开发了Wiener滤波语音增强方法,Wiener滤波器是最小均方误差(Minimum Mean Square Error)下的最佳线性滤波器,语音信号经过算法增强后信噪比不会很高,但是噪声消除后的保存下来的噪音在特性各方面上会和白噪声相像,而不会是令人讨厌的音乐噪音。1979年,Boll提出了谱减法来抑制噪声的干扰,谱减法的计算方式可以理解为将由噪声产生的功率谱从含有噪声信号的功率谱中用数学的处理方式减掉,然后由两者相减的结果开根号获得振幅谱,通过振幅谱获得的相位集的噪声相位,最后再使用傅里叶反变换来还原出时域信号。到1980年,Maulay和Malpass以软判决为基础抑制噪声的语音去噪算法。而后不久Ephaim和Malan一起合作,并且于1984年提出最小均方误差(MMSE)估计方法。 1987年,Paliwal提出了卡尔曼滤波的语音去噪算法,其打破了Wiener滤波在语音滤波是的缺陷。 Ephaim等人提出了基于HMM的去噪算法,使得以神经网络为基础而衍生出来的新的语音去噪算法不断出现。

近几年来,语音实时实现的质量要求变得越来越苛刻,这成为限制其发展的关键因素。但这并不能阻止实时语音识别的发展,科技的利刃(VLSI和高速DSP等一系列先进技术)为我们扫除了这些语音实时实现的路上的障碍。因此,以小波变换为基础的语音去噪方法和基于人耳听觉掩蔽的语音增强算法也在随着科技发展的需要而不断出现[1]。我们的人耳拥有着完美的听觉功能,它本身可以近似的看作是一个成熟的识别系统,他自身有两个主要的功能,第一个是它能够有效的识别语音信息中的时频特性,第二个是它具有掩蔽效应。人的耳蜗能够对听到语音信号进行高效的时频分析,不同频率的声音在耳膜的不同位置产生峰值。人耳的听觉掩蔽就是如果有两种不同的响度的声音同时作用在耳朵上,则较高的响度将抑制甚至覆盖较低的响度,人耳掩蔽效应的语音增强方法就是基于此而来的。

小波分析被认为是科技兴起的新兴理论。可见小波分析当时的影响是非常大的,仁者见仁智者见智,不同领域的专家学者的评价是不同的。小波变换在多分辨率分析和多尺度分析方面有着其独有的优势,尤其是在信号处理方面,小波变换能够有效的处理与分析信号中的非平稳信号。在当今的技术发展中,小波变换已经融入各行各业,受到各层次专家和学者的重视。在1990年,王建忠与崔金泰一起合作并且提出一种基于样条的正交小波函数,且验证了其尺度函数的时频局部化能力和小波函数的时频局部化能力非常强大。Wickerhauser和Coifman对母小波进行了各种形式的转换,在此过程中提出了小波包的概念,并且在此基础上改进了Mallat算法,而后便又提出了小波包算法。1992年,Mallat等人以信号的奇异性为基础描述了信号和图像的多尺度边缘,用Lipschitz指数在多尺度的基础上描述了信号以及噪声的数学特性,并且提出了模极大值信号增强方法。斯坦福大学的D. L. Dohono与I. Johnstone等人一起在1995年研究提出了小波阈值语音信号增强算法的理论。从此,人们一直在不断探索和研究,而且取得了很大的成就,如东永胜等于2006年提出的四个新的小波阈值函数(去噪效果更为显着),杨维等就如何确定阈值,添加了调整参数,增加获取阈值的灵活性。

1.3论文的研究内容

本文的目的是对语音信号进行去噪。尽管现在语音增强算法尚未被研究人员总结提出成熟的结构体系,但相当多的一部分语音增强算法已经经过实验仿真并且在实际中得到一定应用。本文分析了傅里叶变换和小波变换的信号处理和分析原理,由于小波变换的时频分析优势而选择小波分析方法作为论文语音去噪方法。之后,阐述了小波变换基本理论,分析小波变换的语音消噪方法选择小波阈值法进行语音去噪,其中重点的分析了小波去噪过程中的小波函数选取方式和阈值的确定这两个关键因素。并在此基础之上,研究了传统阈值函数的优劣势,并对两者的缺陷进行优化,提出了针对两者缺陷的的新算法。通过MATLAB程序仿真实验,比较几种语音去噪性能检测标准的数据,对实验仿真结果作出总结。

2语音信号处理的方法

2.1常见的信号分析方法及比较

如果我们只考虑信号处理方面的因素,目前有三种常用的信号分析方法:基于傅里叶变换的传统去噪方法,相干平均去噪法和基于小波变换的去噪方法[3]。最常用的去噪方法是傅里叶变换和小波变换。

我们处理信号的时候,可以把其理解成两种格式:一种是稳定信号,另外一种是非稳定信号。如果信号的性质不会随着时间的变化而改变,那么此信号为稳定信号。若信号中存在稳定信号,则此信号或许会产生不期望事件,但是通过这些不期望事件统计,我们可以求得其先验概率。傅里叶变换是一种比较理想的研究稳定信号的方法,从根本上讲就是稳定信号可以通过分解的方式转变为正弦波的线性组合。同样地,在处理非稳定信号的时候也可以将其转化为小波的线性组合。在研究非稳定信号的过程中,由于我们不能提前知道其中的瞬变事件,所以在分析中我们需要采用与傅里叶变换不同的方式来进行分析,而小波变换分析既适用于非平稳信号,也适用于有分支结构的信号,因此,小波分析就是一种比较理想的适用于非稳定信号分析的技术。

2.1.1傅里叶变换

离散傅里叶变换定义:设x(n)是一个长度为M的有限长序列,则定义x(n)的N点离散傅里叶变换为:

(2.1)

剩余内容已隐藏,请支付后下载全文,论文总字数:18491字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;