论文总字数:37358字
摘 要
如今,物联网(Internet of Things, IoT)技术得到了长足的发展,并且逐渐从工业、军事等领域走向千家万户,走进普通人的生活中。随着IoT技术的普及和广泛应用,其所带来的安全性问题愈发引起人们重视,一个突出的安全性问题是对于IoT设备的访问控制。为了加强IoT设备的安全性,本论文引入IoT语音网关,通过语音识别和认证技术实现对IoT设备的访问控制。语音识别和认证,作为人工智能、生物识别等领域的热门技术,得到了越来越广泛的关注,中国学术界和产业界在语音技术领域也做出了卓越的贡献。
本论文设计并实现了一个基于树莓派(Raspberry Pi)的IoT语音控制和认证系统。文中首先进行需求分析并选定软硬件平台、介绍系统的总体架构和运行流程,随后分别论述语音识别、语音认证和MQTT通信三个功能模块的理论、技术,以及基于CMU Sphinx、ALIZE、mosquitto等工具集的开发,并对语音识别、语音认证和MQTT通信三个功能模块进行测试和分析。此外,文中也说明了作为IoT终端设备的ESP8266无线网络模块的结构、特点、软硬件开发方式和在嵌入式系统上实现MQTT应用层协议的方法。最后,将各个子系统集成部署在树莓派平台上测试运行,运行结果表明该系统可用。
关键词:物联网,语音控制,语音认证,树莓派
Design and Implementation of a Raspberry Pi based IoT Voice Control and Authentication System
Zhang Yangming (09013322)
Supervisor: Ling Zhen
ABSTRACT
In recent years, the rapid growth and widely application in industry, military and home of the technology of Internet of Things (IoT) have changed the world. With fast and widely spreading of applications on IoT, safety issues on IoT are becoming increasingly serious. One of these issues is access control for devices linked to IoT networks. In order to enhance the safety of IoT devices, an IoT speech gateway is introduced in this paper. As parts of technologies on artificial intelligence and biometrics, voice recognition and voice identification has attracted more and more attention of scholars and industry circle. Chinese academics and industry have made a significant contribution on this field.
This paper demonstrates a method of designing and implementing an IoT voice-control and voice-identification system based on a single board computer which is called Raspberry Pi. First of all, a requirement analysis is made and the platform of software and hardware is determined. The architecture and operating procedure of this system are also illustrated. Then, theories and technologies of voice recognition, voice identification and MQTT communication are introduced, and re-development based on open-source libraries and toolkits such as CMU Sphinx, ALIZE, mosquito is demonstrated. Tests on these functional modules are accomplished in order to assemble them later. The results of the tests are also analyzed. Moreover, the structure, features, methods of software and hardware developing, and the route to implement the MQTT application-layer protocol on embedded systems of the ESP8266 wireless network module as IoT terminal device are introduced. Finally, the subsystems are integrated and the completed system installed on Raspberry Pi platform is configured in order to run overall testing. The test result validates its feasibility and effectiveness.
KEY WORDS: IoT, voice control, voice identification, Raspberry Pi
目 录
摘要
ABSTRACT
第一章 绪论 1
1.1 选题背景 1
1.2 研究现状 2
1.2.1 IoT硬件设备 2
1.2.2 语音控制 2
1.2.3 IoT网络通信 3
1.3 研究目标和研究内容 3
1.4 论文组织结构 4
第二章 系统总体设计 5
2.1 需求分析与平台选择 5
2.1.1 树莓派单板计算机 5
2.1.2 ESP8266无线网络通信模块 7
2.2 架构设计 8
2.2.1 IoT网络拓扑和系统部署 8
2.2.2 软件系统架构 10
2.3 流程设计 11
第三章 语音识别 13
3.1 Sphinx语音识别引擎介绍 13
3.2 语音识别的基本理论和算法 13
3.2.1 语音编码与特征提取 13
3.2.2隐马尔可夫模型(HMM) 15
3.3 Sphinx安装部署 16
3.3.1 依赖软件和PocketSphinx安装 16
3.3.2 语言模型生成 17
3.3.3 执行语音识别 18
第四章 语音认证 20
4.1 ALIZE工具集介绍与部署 20
4.2 语音认证的基本理论和算法流程 21
4.2.1 基于GMM-UBM的语音认证技术 21
4.2.2 分类判定规则 22
4.3 GMM-UBM模型训练与结果决策 22
4.3.1 MFCC参数提取 22
4.3.2 静音去除与特征参数标准化 23
4.3.3 UBM-GMM训练和判定分数标准化 23
第五章 MQTT协议及其实现 25
5.1 MQTT协议介绍 25
5.2 MQTT协议的实现 26
5.2.1 树莓派MQTT服务器的实现 26
5.2.2 ESP8266的MQTT客户端实现 27
5.3 MQTT消息传输测试 29
第六章 系统实现与测试 30
6.1 流程控制程序 30
6.2 IoT终端设备 31
6.2.1 传感器读取 31
6.2.2 GPIO操作 32
6.3 功能测试 33
6.4 语音识别和认证性能测试 36
第七章 总结与展望 38
7.1 论文总结 38
7.2 工作展望 38
参考文献
致谢
第一章 绪论
1.1 选题背景
随着网络技术、通信技术和计算技术的发展,将传统上不联网工作的设备接入互联网,实现万物互联,已经成为可能。万物互联形成的全新网络形态,称为物联网(Internet of Things, IoT)。目前,物联网产业发展势头良好,前景广阔。仅仅在我国,2016年全年物联网连接数达到1.6亿[39]。放眼全球,国外英特尔、高通、苹果、亚马逊等,国内中兴、华为、海康威视等行业巨头都已经在积极布局物联网产业的发展战略。在“互联网 ”等新理念、新政策的推动下,截至2016年7月末,国内披露获得融资的物联网创新企业已有276家[40],已经形成了遍地开花之势。可见,IoT行业将很可能在未来的几年内对传统的互联网行业产生巨大影响,深刻改变行业面貌。
IoT将众多传感器、伺服器和计算机集成在同一个网络中,使得网络拥有了与现实世界进行交互的能力。IoT真正将互联网上的信息流下沉到真实世界中,实现全方位的自动控制,节约了人类的精力。目前,除了在工业、农业、军事等领域,家居自动化也是IoT发挥其能力的一个重要领域。针对家居自动化的需求特点,IoT设备必须支持足够友好的人机交互方式,而语音交互是最为友好的人机交互方式之一,也是未来大有前途的发展方向。目前,自动语音识别(Auto Speech Recognition, ASR)技术已经相当成熟,并且发展迅速,不仅识别精确度达到了非常高的水平,而且可以运行在不同的系统平台之上,极大地扩展了语音识别的应用场景。ASR结合了语音处理技术和机器学习技术,可以将人类语音转换成机器可识读的文字符号,利用该技术可以实现快速、准确的语音交互,提升了用户的使用体验。并且,作为人工智能领域的重要技术,将ASR引入IoT,大大提高了IoT的智能化水平。
剩余内容已隐藏,请支付后下载全文,论文总字数:37358字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;