基于LPC的藏语语音基音周期的检测分析

 2022-10-16 11:50:24

论文总字数:16800字

摘 要

随着人工智能和计算机技术的高速发展,人们越来越关注语音信号在处理各个领域的重要性。特别是基音周期,基音周期可以帮助我们识别语音发声源,并且作为语音特有的重要参数,基音周期的检测对于帮助提高智能语音识别技术有着至关重要的作用。

本文介绍了以线性预测编码(linear predictive coding, LPC)为技术的语音基音周期检测技术。由于当前大部分的研究对象都是针对的汉语,对于一些少数民族的语音处理还相对落后,所以本文以藏语作为研究对象,采用了基于隐马尔科夫模型(Hidden Markov Model, HMM),来进行语音基音检测框架的构建,通过采样,量化,分帧加窗,语音预处理提取语音的梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients, MFCCs)作为声学特征,最后对隐马尔科夫模型进行训练识别,从而实现了藏语的语音基音周期的检测分析。

综上所述,我们需要对线性预测分析(LPC)有一个全面准确的认识,深入学习LPC的基本概念和原理,了解基音周期的相关定义,在语音处理模块有效地使用LPC技术。这对于语音处理的研究而言是非常重要的。

关键词:LPC;藏语语音;基音周期;HMM;

Detection and analysis of Tibetan speech pitch

period based on LPC

Abstract

With the rapid development of artificial intelligence and computer technology, people pay more and more attention to the importance of speech signal in various fields. Especially pitch period, pitch period can help us identify the source of speech, and as an important parameter of speech, pitch period detection plays a vital role in helping to improve intelligent speech recognition technology.

The linear predictive coding (linear predictive coding, LPC) technology is introduced in this paper. Since most of the current object of study is aimed at Chinese, for some minority's voice is still relatively weak, so in this paper, the Tibetan language as the research object, adopted based on Hidden Markov Model (Hidden Markov Model, HMM), to the architecture of speech pitch detection, through sampling, quantification, add a window frame, voice pretreatment extract voice of Mel Frequency cepstrum coefficient (Mel-Frequency Cepstral Coefficients, MFCCs) as acoustic features, Finally, the hidden markov model is trained and recognized, so as to realize the detection and analysis of pitch period of Tibetan speech.

To sum up, we need a comprehensive and accurate understanding of linear prediction analysis (LPC), in-depth study of the basic concepts and principles of LPC, understand the relevant definition of pitch period, and effectively use LPC technology in voice processing module. This is very important to the research on speech processing.

Key words: LPC; Tibetan speech; pitch period; HMM;

目录

摘要 II

Abstract III

第一章 绪论 1

1.1语音基因周期的研究背景及意义 1

1.2国内外发展现状 1

1.3论文内容结构安排 2

第二章 隐马尔科夫(HMM)模型的概述 3

2.1隐马尔科夫模型的简介 3

2.2隐马尔科夫模型的三大问题 3

2.3 HMM在语音处理中的应用 5

第三章 语音基音周期 6

3.1 LPC分析的基本原理 6

3.2语音信号的分析 6

3.2.1语音信号的线性预测模型 7

3.3基音周期检测的方法 7

3.3.1基于自相关的基音周期的检测 8

3.3.2基于倒谱法的基音周期的检测 8

3.3.3基于LPC方法的基音周期的检测 9

3.4基音检测的预处理 9

第四章 基音检测的仿真实现 11

4.1藏语语料库的建立 11

4.2提取MFCC声学特征 12

4.3模型的训练 12

4.4参数的生成和分析 13

4.5实验结论与分析 14

第五章 结束语 15

5.1设计总结 15

5.2展望 15

致谢 1

参考文献 2

附录 1

绪论

1.1语音基因周期的研究背景及意义

伴随着技术的高速更迭,人类逐渐步入到了高速发展的信息化和人工智能化社会。计算机可以帮助我们构建各种模型来处理我们所遇到的难题,我们所研究的不仅仅是那“高、精、尖”的尖端技术,而是那些贴近我们生活与我们密切相关的技术。当今交通因为新技术变得越来越便捷,全球化进程越来越迅速,人与人之间的语言交流就显得非常的重要。 人们最原始与最普通的交流方式就是说话,语音正是说话的表现,所以我们需要对语音进行研究,分析它的特点,利用新的技术手段来对其进行处理,让我们可以更加有效的利用它。语音由发声系统产生,发声系统又可以通过简单的声源和声道模型来进行模拟。

基音,话句话说就是声音的基础的意思。对于人类的发声而言,因为声带振动方式的不同和每个人声带的差别,我们可以把声音区分为清音和浊音。所以我们引入了基音周期这个概念,声带周期性震动制造出了浊音,因此我们把浊音的频率定义为基音频率。根据相关调查表明,基音的频率和每个个体的声带结构关系非常密切,因此如果想识别发声源,我们可以根据基音频率。对于人类个体而言,成年男性说话的声音频率较低,女人和儿童的声音相对较高。这也正是为什么生活中大部分男性声音比较低沉,而女性和儿童相对甜美。所以对于基音的研究就和我们的生活变得息息相关了。基音检测,也就是对语音进行估计,目标是为了找出和声带振动频率完全一致或尽可能相吻合的轨迹曲线。

剩余内容已隐藏,请支付后下载全文,论文总字数:16800字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;