基于支持向量机模型的语言种类识别方法的研究

 2022-12-25 10:52:34

论文总字数:18205字

摘 要

语言种类识别是指通过说话人的语音判别出其所说的语种的一种生物认证技术,该技术凭借卓越的便捷性、实惠性和准确性等优势受到了举世瞩目,它在现代许多领域内有良好的应用前景。

此次设计就是研究基于支持向量机(SVM)模型的语言种类识别方法。过程包括语音信号的采集、预处理、建模、提取特征参量和模型的优化,从而达到这样目的,即语言种类识别。语音信号的采集需要A/D变换,可直接利用声卡实现,其他环节都由软件实现(如Matlab)。此外,语言种类识别任务对训练时间要求不高,而识别时间要求实时。经过上述过程建立的系统,在当今生活中有着很好的使用价值,有必要不断加大力度继续投入研究,完善,填补这一方面的空白,充分利用这一技术,更好的服务生活。

关键词:语种识别;向量机模型;特征提取;Matlab

Research on Language Type Recognition Method Based on Support Vector Machine Model

Abstract

Language type recognition refers to a biometric authentication technology that distinguishes the spoken language from the speaker's voice. This technology is obviously liable for the whole while world because of its great function. What’s more,it has good application prospects.

This design is to study the language type recognition method which is based on support 

vector machine(SVM) model. The whole process includes the acquisition, pre-preprocessing, 

modeling, extraction of feature parameters and model optimization of speech signals, so as to 

achieve the aim of language type recognition. What needs to do for the acquisition of speech

signal is obviously .Such as A/D transformation,which can be realized directly through sound card .Other links can be made true by software(such as Matlab). In addition, the task of language

 type recognition requires little training time, while the recognition time requires real time. The 

system established through the above process has a good use value in today's life, it is necessary to continuously increase efforts to continue to invest in research, improve, fill the gap in this aspect, make full use of this technology, better service life.

Key words: Language Recognition ,Support Vector Machine,Speech Feature Extraction,Matlab

目 录

摘 要 I

Abstract II

第一章 引 言 1

1.1 语种识别技术的背景 1

1.2 可行性分析 1

1.3 语种识别技术的研究现状 1

1.4本论文的概况安排 2

第二章 语音信号的基本处理与算法分析 3

2.1语音信号的形成 3

2.2语音信号生成模型 3

2.3语音信号分析 4

2.3.1语音信号分析系统 4

2.3.2分帧加窗处理 4

第三章 语言种类识别系统的基本方法与结构 6

3.1 语种识别系统结构 6

3.1.1模式匹配 6

3.2语音信号的基音周期估计 7

3.2.1原理与方法 7

3.2.2倒谱法基频检测 7

3.3常用的特征语音参数 8

3.3.1LPC倒谱参数 8

3.4线性预测分析 9

3.4.1基本思路 9

3.4.2实验过程 9

3.4.3实验结果与分析 10

3.5语种识别中判别方法和阈值的选择 11

第四章 基于支持向量机的语言种类识别 13

4.1支持向量机原理 13

4.2常用的训练分类器 15

4.2.1最小距离法 15

4.2.2向量机模型法 15

4.3语音库的构建 16

4.4语种识别分析流程与实现 16

4.4.1svm二分模式语种识别算法实现 16

4.4.2svm多模式语种识别算法实现 18

第五章 总 结 20

5.1实验结果总结 20

5.2研究展望 20

致 谢 21

参考文献 22

第一章 引 言

1.1 语种识别技术的背景

近几十年来,语音识别技术发展迅猛,世界各国间的交流也越来越频繁,但是,由于世界上的语言种类是数以千计的。那么在商务活动中,总会出现不知道客户或者供应商说的是啥语言的情况,这很可能给彼此留下不好的印象,甚至可能导致生意的失败,诸如此类,由于中国的改革开放,加入世贸组织对经济的影响不言而喻,国内对于多语种服务的需求越也在急剧增长。无论是提供多语言翻译服务还是多语言自动化服务,都必须首先了解用户创建的语言。语种识别技术对用户提出了许多要求。语种识别系统是识别用户输入类型的系统。口头识别研究在多语言和翻译服务,国际呼叫控制系统,多语言电视和广播监视,翻译识别系统以及语音识别中起着重要作用。

支持向量机不同与传统的学习方法,它是基于统计学习理论中的结构风险最小化,SVM目的依靠让结构风险最小化,从而得到学习后对未知集合的识别错误率最小的目的,而不是为了达到训练集的性能最优而通过降低经验风险。

1.2 可行性分析

随着近几十年来通信信息技术的高速发展,以及大规模集成电路和大型计算机的涌现,使得像语言种类等需要大量计算的需求带来了福祉,使其研究及应用成为了可能。此外,伴随向量机模型的理论成熟,它作用于语音信号处理已成为了可能。近年来,由于语音识别技术的逐渐实用化,支持向量机模型也随之高速发展。尤其是21世纪以来,深度神经网络的理论基础日益成熟,以及以谷歌和微软为首的企业将深度学习源码进行开放,这都极大地便利了我们将深度神经网络作用于语言种类识别。提及特征提取,所使用的语音的特征如LPC倒谱系数,能量等特征参数早已应用于语音识别等领域。所以,本文所使用的特征提取参数分析等方法和理论有了成熟的条件储备,本课题的可行性是显而易见的。

1.3 语种识别技术的研究现状

由于实用需求和DSP技术的高速发展,说话人语言种类识别的科学探索已经开始从实验室走向生活使用。当今,语种识别的科学探索从应用角度划分可以分为两个方面:

(1)根据需要,完成语音信号的特征参数提取与混合。

剩余内容已隐藏,请支付后下载全文,论文总字数:18205字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;