论文总字数:25405字
摘 要
随着目前互联网应用的广泛普及,网络安全也变得日益重要。文本验证码作为一种提高安全性的技术手段而被广泛采用,但同时也浮现了大量攻破验证码的应用程序,其中用深度学习中卷积神经网络作为识别引擎的,都似乎取得了比较高的破解率。本文基于深度学习中卷积神经网络的方法对简单文本验证码图像进行识别,研究了文本验证码用于安全验证时的安全漏洞,探讨了提高验证码安全性的设计方案。本文通过设计出较为通用的卷积神经网络拓扑结构,采用真实生活中几大银行使用的典型验证码作为数据集,通过预处理使数据集数据更加正确规范,再通过预训练使该卷积神经网络具有良好的初值,采用DROPOUT等多种方式提高模型的泛化能力,得到在这多种验证码中综合取得较高的识别准确率的模型,再通过离线和线上测试评估模型破解验证码的实际效果,分析验证码的安全漏洞。
最后,我们根据研究的实验过程和对实验多种测试结果的综合分析,为提高验证码安全性提供建设性方案。
关键词:卷积神经网络,验证码识别,安全性
ABSTRACT
With the widespread use of Internet applications, network security has become increasingly important. Text verification code is widely used as a technical means to improve security, but at the same time, a large number of applications that break through the verification code have emerged. Among them, the deep learning deconvolution neural network as the recognition engine seems to have achieved a relatively high level. Crack rate. This paper identifies the simple text verification code image based on the method of convolutional neural network in deep learning, studies the security vulnerabilities of text verification code used in security verification, and discusses the design scheme to improve the security of verification code. In this paper, by designing a more general convolutional neural network topology, using the typical verification code used by several major banks in real life as the data set, the data set data is more correctly standardized by preprocessing, and then the convolutional nerve is pre-trained. The network has a good initial value, and adopts various methods such as DROPOUT to improve the generalization ability of the model, and obtains a model that comprehensively obtains a high recognition accuracy rate among the plurality of verification codes, and then performs verification by offline and online test evaluation models. The actual effect of the code, analysis of the security hole of the verification code.
Finally, based on the experimental process of the study and the comprehensive analysis of the various test results of the experiment, we provide a constructive solution to improve the security of the verification code.
KEY WORDS: convolutional neural network, CAPTCHAS, security
目 录
摘 要 2
ABSTRACT 3
第一章 绪论 6
1.1引言 6
1.2 研究现状 7
1.3 本文研究目的和主要研究内容 8
第二章 卷积神经网络基础 9
2.1 神经网络概要 9
2.2 卷积神经网络基础 10
2.2.1 卷积层 11
2.2.2 池化层 11
2.2.3 全连接层 12
2.2.4 其他重要的方法和概念 12
2.3 本章小结 15
第三章 漏洞检测的模型方案 16
3.1 基本流程 16
3.2 数据采集 16
3.3 验证码图像特征的提取 17
3.3.1 方法流程 17
3.3.2 模型搭建 17
3.4 图像特征的分类算法研究 18
3.4.1 方法流程 18
3.4.2 模型搭建 19
3.5 本章小结 20
第四章 实验验证与安全防御 21
4.1 实验环境部署 21
4.1.1 数据采集程序环境 21
4.1.2 识别引擎程序环境 21
4.2 图像数据集采集与预处理 21
4.2.1 实验数据集 21
4.2.2 数据预处理 24
4.3 预训练模型 27
4.4 测试模型和结果分析 35
4.4.1 离线测试 35
4.4.2 线上测试 36
4.5 安全防御方案探讨 37
4.6 本章小结 38
第五章 总结与展望 39
5.1 论文总结 39
5.2 工作展望 39
致 谢 40
参考文献(References) 41
第一章 绪论
1.1引言
近些年来,随着互联网技术的飞速发展和互联网普及率不断飙升,大量网络应用迅速融入大众生活之中,并日益成为人们日常生活中必不可少的一部分。一些人们为了快速牟取暴利而制作了大量自动化程序(机器人),用这些恶意的机器人程序对网络应用进行频繁的攻击,例如:通过批量注册用户来攻破对方的服务器;对购票系统进行批量的刷票,然后在以高价卖出;对线上投票进行刷票等等。因而急需一个能区分开人类和机器人的技术手段用来抵御这些恶意机器人程序,验证码由此而生,随之迅速普及开来。
验证码(CAPTCHA),是一种用来区分计算机和人类的全自动图灵测试,由Louis Von Ahn等人在2003年提出的,并从那时起就开始被广泛应用于各种地方。图片验证码以其简单易生成,易操作,人机交互性较好,而且仍然能够比较有效地区分计算机和人类,现仍广泛地被各类网络应用采用。据统计,全球有超过350万的网站论坛在使用验证码,而且每天有超过 300 万以上的验证码被用于安全验证。验证码显然已成为保障网络生活安全必不可少的利器。但是一些黑客们仍然可以通过较为智能的方法将其自动破解,突破这道安全墙。为了应对这些恶意性攻击,各大网站对验证码的形式进行了安全性的升级改造,继而出现了如今验证码形式百花齐放的局面。大概有这几种类型:文本输入式验证码,图片输入式验证码,行为滑动式验证码,图片选择式验证码等。后面几种验证码相对于传统的文本输入式验证码的安全性确实得到不同程度的提升,但是同时也增加了技术、维护上的成本。因而目前使用最广泛的验证码仍是基于文本的输入式验证码,即在一张验证码图片中存在若干个字符,用户需要顺序输入与图片中相同的字符(有时不区分字母的大小写)才可以通过验证。
剩余内容已隐藏,请支付后下载全文,论文总字数:25405字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;