语音信号寂声段和语声段检测方法的研究

 2023-02-03 10:20:05

论文总字数:16080字

摘 要

本篇大学毕业设计论文是对寂声段和语声段检测方法的识别和研究。论文介绍了高阶累积量与语音识别方面的专业知识和软件开发平台开发工具MATLAB5.3的特点。这些知识成为开发语音识别器的基础。以此为基础,利用软件开发平台的MATLAB5.3开发出应用软件语音识别器来对语音信号的寂声段和语声段进行逐步研究。

本次研究主要采用了短时信号处理的方法,它的目的就是为了识别。通过利用高阶累积量方面的数学知识来以此为依据编写算法,然后对输入的语音信号进行预加重、加窗,最后将每一帧语音信号用向量来表示出来,并按照一定算法形成标准。把这个标准作为参照用匹配法进行语音识别。

这次研究是一个典型的应用型研究。不仅要研究语音识别算法和数学原理,还要将两者用程序的形式联系起来。

关键词:寂声断和语声段;高阶累积量;语音识别;

Research on speech signal silence and speech segment detection method in noisy environment

Abstract

This thesis is about the identification and research of the detection methods of silence and voice.This paper introduces the professional knowledge of high order cumulant and speech recognition and the characteristics of software development platform development tool MATLAB5.3.This knowledge forms the basis for the development of a speech recognizer.On this basis, the software speech recognizer was developed by MATLAB5.3 of the software development platform to study the silence and speech segments of the speech signal step by step.

This study mainly USES the short-time signal processing method, which is for the purpose of identification.The algorithm is written based on the mathematical knowledge of high-order cumulants, and then the input voice signal is pre-weighted and windings are added. Finally, each voice signal is represented by a vector, and a standard is formed according to a certain algorithm.This standard is used as a reference for speech recognition by matching method.

This study is a typical application study.We should not only study the speech recognition algorithm and the mathematics principle, but also link them with the program form.

Key words: silence sound break and voice segment;Higher order cumulants;Speech recognition.

目 录

第一章 绪论 1

1.1语音识别介绍 1

2.2 高阶累积量运用介绍 1

2.3 试验工具Matlab5.0介绍 2

第二章 语音信号处理基础 3

2.1 引言部分 3

2.2 语音信号的特性 3

2.2.1 语音的声学特性 3

2.2.2 语音信号的统计特性 4

2.3 汉语语音学 5

2.4噪声特征 6

第三章 高阶累积量 8

1.1高阶矩高阶累积量定义 8

3.2 高斯过程的高阶累积量 10

3.3 高阶累积量的性质 12

第四章 试验及其分析 16

4.1预处理 16

4.2基于高阶累积量的语音信号寂声段和语声段识别 17

致谢 19

参考文献 20

附录 21

第一章 绪论

1.1语音识别介绍

如今计算机变得越来越智能化,可是在早期语音识别对人类来说还是个陌生的词汇,人们绞尽脑汁将计算机和人联系在一起。从古至今有无数科学家和研究者不断钻研和探索就是为了达到这个目标。虽然语音识别出现已久,但是仍处于发展阶段。目前的语音识别技术还是尚未成熟,很多方面需要改善,我们距离想要达到计算机与人类自然交流的目标还很遥远。这份工作也极具挑战,无数研究者钻研于此。

二十世纪中期国外掀起的研究现代语音识别技术的潮流,线性预测编码(Linear Predictive Coding,LPC)方法和动态时间规整(DTW)技术这两项技术最具典型。关于线性预测编码(LPC)以人的发声机理原理为基础,接着对声道的短管级联模型进行进一步研究的。之所以声学特征可以广泛使用,是因为它在计算上的快速有效。线谱对LSP、反射系数与LPC预测参数模型的声学特征原理差不多。

IBM语音研究小组是语音识别技术的组织,由于他们开始发现和研究大词汇语音识别工作相对比较早其他,国家组织就比较滞后,所以他们在大词汇语音识别技术方面是世界一流的。ATamp;T的贝尔研究所也是专门研究关于非特定人语音识别的。即使研究时长很多,但它的成果讲述了关于非特定人语音识别的标准模板的方法的制作过程。

这段时间也有很多相关的研究突破很大进展,比如隐马尔可夫模型(HMM)技术,它的着手研究,经历了成熟期最终却成为了语音识别方面的主流方法,隐马尔可夫模型(HMM)技术目前应用也很广,在国际地位也特别靠前。人们对以知识为基础的语音识别的研究的关注度日益增长,所以这期间这类型的研究者大量涌现。在研究连续语音识别时,我们也需要注意的是识别声学信息和更多地利用各种语言知识这两个方面对语音识别和理解有很大帮助,更好的掌握他们能较轻松的解决语音识别技术上的难题。与此同时,人们在语音识别研究过程中,还产生一种语言模型,此模型能够应用早统计概率方面,这一发现既给研究者信心也取得了一些实质的成果。

2.2 高阶累积量运用介绍

剩余内容已隐藏,请支付后下载全文,论文总字数:16080字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;