论文总字数:21400字
目 录
1 绪论 3
1.1 研究背景与意义 3
1.2课题的国内外研究现状 4
1.3 本文的结构与内容 4
2 图像的内容特征介绍 5
2.1 SIFT特征 5
2.2 HOG特征 9
3 基于机器学习的图像检索相关技术 9
3.1深度学习的相关结构和算法 9
3.1.1 人工神经网络 9
3.1.2 反向传播算法 11
3.2 卷机神经网络的结构和原理 13
4 图像特征索引的建立 14
4.1 近似最近邻搜索 14
4.2局部敏感哈希 15
5 CNN模型的训练与应用 16
5.1 Caffe的介绍 16
5.2 Caffe的工作原理 17
5.3 Caffe的结构 18
5.4 Fine-tuning 19
5.5 卷机神经网络的建立 20
5.6 图片的相似搜索 21
5.7 算法流程 22
6 实验结果与分析 23
6.1 在CIFAR-10数据集上的模型训练 23
6.1.1 在CIAFR-10上训练并获取训练模型 23
6.1.2 根据预训练的模型做fine-tuning训练 24
6.2 利用CaffeNet模型做fine-tuning训练 26
6.3 检索预处理与实现 26
6.3.1 根据训练的模型批量提取图像特征 27
6.3.2 提取待检索图像的特征并显示检索结果 29
7 全文总结与展望 31
7.1 全文总结 31
7.2 工作展望 32
参考文献 33
致谢 35
基于CNN特征的图像搜索算法设计与实现
崔琦
,China
Abstract: In some cases, the image owner wishes to automatically and efficiently classify and retrieve the images. In the field of large-scale image retrieval, the method of representing features through the image itself is more effective, that is content-based image retrieval method. The common image similarity of image color, shape feature extraction search, this method will be due to environmental factors affect the search results, at the same time, the matching degree of each computational overhead is relatively large, real-time is not high. Convolutional neural networks have very good results in image classification tasks. In this paper, we use deep learning technology. Firstly, we use the training model to let the machine learn picture features, and then use the method to transform the eigenvalues into two valued hash codes to improve the computing speed of the model. Compared with the method of extracting pictures manually, it can not only reduce the error, but also reduce the cost of computing similarity and reduce the computation time. The convolutional neural network, training image recognition model through the method of trimming network and migration, in order to make the training model more similar to the image classification task, this paper according to the structure of a convolutional neural network was improved. In the training process, the network can obtain the image representation information and the two value hash code used for retrieval. Finally, we obtained the model accuracy by 93% of our own small size image set. We use the trained model to retrieve several structurally similar image classes, and improve the retrieval accuracy by adjusting the network structure.
Key words:Content-based image retrieval; CNNs; Fine-tuning Strategy
1 绪论
1.1 研究背景与意义
当今社会是一个数字化的时代,无论是高速公路上的测速拍照,还是普通人使用手机照相对生活的记录,都表征着数字信息处理与存储的形式已经从文字时代变革到图像信息时代。
由于其能承载更丰富、生动的信息,网络用户非常依赖于图像信息。往往图片的数据庞大且来源广泛,对于承载同一种类内容信息的图片,相似检索操作也就更加依赖计算机和算法。
通过阅读早期文献,发现基于文本图像检索的方法主要是给图像库中的每一张图像增加标签(label)信息,然后得到待检索图像的标签信息后,反馈检索结果。这种方法没有在图像内容层面上解决检索问题,因此往往忽略了图像的内容所表达的信息,其原理如图1-1所示。此后,图像检索方法得到改进,并出现了基于图像本身内容的相似检索方法,其原理如图1-2所示。
图 1-1 基于文本图像的检索方法
图1-2 基于内容的图像检索方法
常见的基于内容的图像相似搜索通常利用图像的颜色或形状提取特征,例如SIFT特征描述子[1],SURF特征描述子[2],HOG[3]特征描述子等。通过对图像的特征值使用欧几里得距离公式来衡量图像间的相似度。随着图像数据的复杂度和数据量的增大[4],实时提取特征的开销会增大,同时计算相似性的代价也会增加。同时,此种方法依然没有解决在图像的高层语义层次上表达图像特征的问题。机器学习方法正是通过希望机器可以训练出类似于人类神经网络结构的网络,从而解决理解人类高层语义概念的问题。
1.2课题的国内外研究现状
近来,图像处理与取证等领域中,许多学者使用了深度学习方面的方法开拓新的思路,基于CNN( Convolutional Neural Network )[5]的方法在许多图像任务上表现卓越。例如,许多图像识别任务显示了诸如VGG [6],GoogleNet [7]和最新的ResNet [8]等非凡性能。 通过使用基于DCNN [9]的方法,他们在ImageNet [10]大型视觉识别挑战( ILSVRC )中做出了巨大贡献。Xin R[11]将卷积神经网络和哈希函数进行结合,得到学习二值哈希码,以便完成对图像进行检索。与传统方法相比,CNN可以在面对传统方法无法有效识别特征的情况下,更好地处理任务。
1.3 本文的结构与内容
第一章 绪论。在本章中,简明地介绍了图像检索的主要任务与哈希算法的作用,结合深度学习的方法,将其应用于图像搜索算法。本章最后介绍了全文的结构与内容。
第二章 图像的内容特征的简介。基于图像内容的相似度检索,是将多张图像放在一起,针对表示图像内容的特征进行欧几里得距离运算,因此该检索的关键在于对每一张图像的内容特征的选择。本章介绍梯度直方图方法(HOG)和尺度不变特征变换(SIFT)方法,两种用来表征图像内容特征的方法。
第三章 基于深度学习的图像检索相关技术。在此部分,首先介绍了深度学习的定义与原理,进一步重点分析本文所用的卷机神经网络的定义与原理。在本章的最后使用原理图和流程图的方式,对将卷积神经网络运用于图像搜索进行解释。
第四章 图像特征索引的建立。本部分主要介绍了用于检索的特征索引的建立,分析了最邻近搜索的问题以及本文所应用的局部敏感哈希算法。
第五章 CNN模型的训练与获取。本章包括深度学习框架Caffe的介绍与使用。介绍了本文所使用的卷机神经网络结构与在一些例如CIFAR-10、ImageNet等公共数据集上训练CNN模型的方法。
第六章 实验结果与分析 本章介绍了使用上述的模型实现与待检索图像内容结构类似的图像搜索过程。
剩余内容已隐藏,请支付后下载全文,论文总字数:21400字
相关图片展示:
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;