基于模糊理论的语言种类识别方法的研究

 2022-12-25 10:52:29

论文总字数:15547字

摘 要

语言种类识别是指通过语音来自动识别语种的过程,就是依据人声来辨别语种的一种生物认证技术,其拥有自己特殊的优势而被受世人关注,比如更加方便、经济实惠和精准度高等,其在现代大量领域内有良好的应用前景。

此次设计就是研究基于模糊矢量量化模型(FVQ)算法的语言种类识别的方法。包括语音信号的采集、预处理、建模、提取特征参量,以及模型的优化,最后进行语言种类识别。语音信号的采集需要A/D变换,可直接利用声卡实现,其他环节都由软件实现。语言种类识别任务对训练时间要求不高,而识别时间要求实时。完成后的系统既可以对语音库中的语言种类进行识别,测试特征参数的识别效果,也可以作实时的语言种类识别系统。

关键词:语言种类识别;模糊矢量量化模型;A/D变换;实时

Research on Language Type Recognition Method Based on Fuzzy Theory

Abstract

Language type recognition refers to the process of automatically recognizing speakers through voice. It is a biometric authentication technology that recognizes speakers based on human voices. It has attracted worldwide attention for its unique convenience, economy, and accuracy. It has good application prospects in many modern fields.

This design is to study the method of language type recognition based on fuzzy vector quantization model (FVQ) algorithm. Including speech signal collection, pre-processing, modeling, extraction of feature parameters, and model optimization, and finally language recognition. The collection of voice signals requires A / D conversion, which can be realized directly with the sound card, and all other links are realized by software. Language type recognition tasks do not require high training time, and recognition time requires real-time. The completed system can not only recognize the speaker language type in the speaker voice library, test the recognition effect of the characteristic parameters, but also can be used as a real-time language type recognition system.

Key words: Language Type Recognition, Fuzzy Vector Quantization Model,A / D Transformation,Real Time

目 录

摘 要I

AbstractII

第一章 引 言 1

1.1研究的背景与意义 1

1.2 本课题的研究思路 1

1.3 本论文的结构安排 2

第二章 自动语种识别3

2.1语言识别系统概述3

2.2 自动语言识别系统4

2.3 语音信号的预处理5

2.4 LPC倒谱参数(LPCC)5

2.5 识别中判别方法和阈值的选择6

第三章 矢量量化及模糊矢量量化的介绍7

3.1 矢量量化(VQ)7

3.2 模糊矢量量化(FVQ)8

3.3改进的模糊均值算法9

3.4 模糊矢量量化的过程10

3.5 码本的设计10

3.5.1 初始码本11

3.5.2改进初始码本设计11

3.6 失真测度12

3.6.1欧氏距离测度12

3.6.2 线性预测失真测度13

3.7 语音信号的处理16

第四章 语言识别系统17

4.1 系统实现17

4.2 实验所用的语音数据库17

4.3 实验步骤18

4.4 实验结果18

第五章 总 结19

5.1 实验结论19

5.2 实验的不足和改进19

致 谢20

参考文献(Reference)21

第一章 引 言

1.1研究的背景与意义

随着全球合作关系的发展,各种类型的余元间增加了通信标准,这使智能语言辨识系统面临着巨大的挑战。通过机器来领会某种语言的涵义之前,一定要辨认要利用何种语言。智能语言辨识的主要工作是能够迅速、精准地辨别出现今使用的语言。如今,在通信和信息领域中最热门的话题就是如何智能识别语言,其将各个学术界的技术融合在一起,为了学习它,不但要借助于信息技术与理论知识,而且要拥有处理不同信息的手段与办法。众人皆知,语音包含了大量的信息,通过其可从语音中获得不一样的讯息,构成了不一样的语言处理办法。从内容的层面来讲,语音涵盖了相关语言类型的信息,语音内容中既有语义又有语种。所以,我们要利用识别技术来获取语音中的信息,并将识别语言划分为语音、语言和语种三类。

语种辨识在信息检索与军事领域中发挥着相当关键的作用,可是在初期利用之前一定要选定用户语言,以方便机器提供不同语言种类的服务。语言辨识技术也可通过多语言机器翻译系统来处理前段。在翻译和分类大量纪录的文档之前,必须确定每种声音的语言。随着信息化时代的来临以及互联网技术的不断创新,在国际上语言辨识越来越体现出绝对的运用价值,并且进行了系统性的高效研究。如图1.1便实现了不同语种之间的交流:

图1.1 不同语种识别交流系统

1.2 本课题的研究思路

本课题以模糊矢量量化模型(FVQ)算法算法设计与实现为核心,整个过程包括研究语言种类识别的意义,研究语言种类识别的特征参数的选取,研究几种语言种类识别方法的特点,研究基于模糊矢量量化模型算法的语言种类识别方法以及系统实现。详细研究思路如下图1.2所示:

剩余内容已隐藏,请支付后下载全文,论文总字数:15547字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;