利用神经网络模型降低会议环境下的瞬时噪声

 2022-04-26 22:42:38

论文总字数:38162字

摘 要

传统的信号处理知识和降噪手段,例如各类滤波器,都是从长时的噪声信号中提取特征并进行噪声消除,其对瞬态噪声的去除效果不好;另一方面,在很多特定的环境下,如教室、会议室等,拾音器进行信号加强的过程中,瞬态噪声也随之放大,从而影响到拾音设备的拾音质量。由于传统的降噪手段不能很好地获得瞬态噪声的降噪效果,本文选择深度学习神经网络模型进行噪声特征的学习并降噪,对会议环境下瞬态噪声的降噪问题进行了分析和实现,主要研究内容包括:利用Tensorflow深度学习框架,设计神经网络层,并利用部分加噪的干净语音数据对深度神经网络进行训练,再经由设计的神经网络进行降噪,得到降噪语音数据;观察干净语音、加噪语音、降噪语音的波形和频谱结果,并利用语音质量检测方法评估测试数据质量。结果表明,神经网络模型对瞬态噪声的处理效果良好,有明显的降噪效果,且获得了语音质量评分的提升。

关键词:神经网络,拾音器,瞬态噪声,降噪

ABSTRACT

Traditional signal processing knowledge and noise reduction methods such as various types of filters extract features from long-term noise signals and perform noise cancellation, which has a bad effect on removing transient noise; on the other hand, in many specific environment such as classrooms, conference rooms and so on, during the process of signal enhancement by the pickup, the transient noise is also amplified, which affects the pickup quality of the pickup device. This paper chooses the deep learning neural network model to learn the noise characteristics and reduce the noise, because the traditional noise reduction method can not get the noise reduction effect of transient noise well, and also analyzes and realizes the noise reduction of transient noise in the conference environment. The main research contents include: using Tensorflow deep learning framework, designing the neural network layer, and using the partially-noise clean voice data to train the deep neural network, and then denoising through the designed neural network to obtain the noise-reduced voice data; Observe the waveforms and spectrum results of clean speech, noisy speech, noise-reduced speech, and evaluate the quality of test data using speech quality detection methods. The results show that the neural network model has a good effect on the processing of transient noise, and has obvious noise reduction effect, and the speech quality score is improved.

KEYWORDS: Neural network, Pickup, Transient noise, Denoise

目 录

摘 要 I

ABSTRACT II

目 录 III

第1章 绪论 1

1.1 研究目的和意义 2

1.2 本课题研究内容及要求 2

1.3 软件介绍 3

1.3.1 LINUX 3

1.3.2 PYTHON 3

1.3.3 MATLAB 3

1.4 本文结构 4

第2章 训练数据准备 5

2.1 Aishell语音数据库 5

2.2 噪声准备 5

2.3 加噪过程 5

2.4 本章小结 6

第3章 神经网络模型的设计训练及结果 7

3.1 数据的特征提取 7

3.2 DNN模型设计与训练 8

3.2.1 DNN模型介绍 8

3.2.2 本课题DNN架构和训练 11

3.3 预测及数据重构 16

3.4 波形及频谱对比 17

3.5 本章小结 33

第4章 语音质量检测 34

4.1 几种语音质量检测方法 34

4.2 语音质量检测结果 35

4.3 本章小结 39

第5章 课题总结及未来研究展望 41

参考文献 42

附 录 43

致 谢 50

绪论

语音信号是人类最常用、最核心的信息交换媒介,语言系统是人类物种特有的能力,从古至今,人们生活中的交流方式仍然是以说话的形式为主。如今已经是全面的信息化时代,因此语音信号处理在此时更是显得尤为重要.语音信号处理技术的提升,能够使得人们在生产生活上更为方便、有效,极大地推动社会的发展和进步[1]

信息化时代最特别的一点,就是让计算机听懂人类的语言,这也是自第一台计算机问世后所有人的梦想。人机交互、人工智能以现在的眼光来看,已经不是那么遥远的想象了,它正在办公、金融、教学、商业、交通等等行业中起着非常重要的作用,市场上的很多产品越发的智能化,例如智能音箱、智能家电等等,与人的互动越来越多,甚至可以成为人们情感宣泄的出口,像AlphaGo这样的人工智能“围棋”大师更是因击败了世界围棋冠军而名噪一时。而人工智能化的发展与语音信号处理的发展密切相关,语音识别技术的进步让机器“读懂”人们的可能性和准确率越来越高,相关的产品更是给人以非常舒适的体验。语音信号处理在这一领域的开拓和创新,让我们的生产生活与其变得更加的密不可分。

但是不论是语音识别技术,还是语音增强技术[2],降噪是所有语音处理过程中最重要的。众所周知,噪声是发声体无规则震动产生的干扰波,无论是生活还是工业上,噪声都具有公害性,因此降噪水平始终是人们提高语音质量时首先要考虑的问题。随着语音信号处理技术的逐步发展,降噪效果已经有了很大的提高[3],各类先进的降噪滤波器能够很好地将常见的背景噪声消除,但是随着人们生活水平的不断提高,我们对各类音频设施的要求也是在日益提高,人们一直在研究降噪水平的极限。本文研究的噪声对象为瞬态噪声,即偶尔产生但是每次出现时间都不长的噪声信号。现今在拾音器设备中普遍存在的问题,就是这些瞬态噪声信号经过拾音器后,会随着语音信号的增强而被放大,从而会影响到设备拾音的效果,因此本课题针对瞬态噪声的去噪方法进行研究。

剩余内容已隐藏,请支付后下载全文,论文总字数:38162字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;