基于DCT的图像压缩解压缩算法研究毕业论文
2020-04-10 16:58:40
摘 要
在科技发展的今天,图像信息广泛。但图像的数据量一般都比较大,十分不利于存储和传输。实际应用中,通常需要对图像进行压缩。论文主要研究了按照国际压缩标准JPEG(Joint Photographic Experts Group),并基于DCT(Discrete Cosine Transform)即离散余弦变换的图像压缩和解压缩算法[1]。通过MATLAB及其图像处理工具。论文还详细介绍了编码步骤如,DCT变换、量化、熵编码等模块的原理和数学公式及推导,还有各模块的功能分析。最后应用MATLAB进行实验与仿真并分析结果得出结论。
研究结果表明JPEG图像压缩方法简单方便,是互联网上最普遍的方法之一,其优点在于既能保证压缩比,又能保证图像质量,且MATLAB运行出来的仿真结果较好地反映了其编码算法原理。
关键词:DCT变换;图像压缩算法;MATLAB;JPEG标准
Abstract
In the development of science and technology, the image information is wide. But the amount of image data is generally large, which is very bad for storage and transmission. In practice, image compression is usually required. This paper mainly studies the image compression and decompression algorithm based on the international compression standard JPEG (Joint Photographic Experts Group) and based on the DCT (Discrete Cosine Transform), the discrete cosine transform. By using MATLAB and its image processing tools. The paper also introduces the principles, mathematical formulas and derivation of the coding steps, such as DCT transform, quantization and entropy coding, as well as the functional analysis of each module. Finally, MATLAB is used to carry out experiments and simulations, and conclude the results.
The results show that the JPEG image compression method is simple and convenient. It is one of the most common methods on the Internet. Its advantage is that it can not only guarantee the compression ratio, but also guarantee the quality of the image. And running the simulation results of the MATLAB reflects the principle of the coding algorithm well.
Key Words:DCT transform;Image compression algorithm;MATLAB;Joint Photographic Experts Group
目录
第一章 绪论 1
1.1基于课题的深入研究 1
1.2 数字图像处理 3
1.2.1 数字图像处理内容 3
第二章 图像处理基本原理 5
2.1图像压缩基础 5
2.2 JPEG标准 5
2.2.1颜色模式转换及分块采样 6
2.2.2离散余弦变换 7
2.2.3 DCT系数量化 8
2.2.4 Z字排列 11
2.2.5 熵编码 12
2.3 图像解压缩 14
2.3.1 反量化 反DCT变换 颜色转换 15
第三章 实验仿真及结果 16
3.1 仿真结构 16
3.2 MATLAB函数 16
3.2.1 图像的读入和输出 16
3.2.2 图像转换 17
3.2.3 DCT变换实现 19
3.2.4 Z型扫描的实现 20
3.3 仿真结果图象 20
3.4 实验结果分析 23
第四章 总结与展望 24
第一章 绪论
如今,大量的视觉信息,如图像和视频,每天都在产生和交流。因此,视觉信息的管理和分析在多媒体和信号处理研究领域和应用中成为一个具有挑战性的问题[2]。各种便携式设备(如数码相机或手机)的普及,可以很容易地捕捉图像或视频,并通过网络共享它们,使得图像内容管理和分析比以前更为重要。另一方面,为了解决带宽和存储问题,这些视觉数据中的大多数都以压缩形式(如JPEG或MPEG)存储或传播到世界各地[3]。然而,压缩的可视数据增加了处理时间。
由于视觉信息的管理、分析或索引通常是在像素域中进行的。压缩数据方面,将解压缩过程添加到数据处理和分析的复杂性中[4]。因此,在不同的领域中,以压缩格式直接处理图像或视频是个非常有吸引力的问题,并且人们已经提出了许多不同的应用和研究领域的方法来直接处理和分析压缩域中的视觉数据。在基于内容的图像和视频检索中,它们的范围从图像恢复或者增强,到人脸识别和伪造或篡改检测,甚至更广泛。另一方面人们已经做了一些尝试,为了压缩视觉数据和视频的内容访问、检索和总结制定一个标准框架。
1.1基于课题的深入研究
首先是一种JPEG向后兼容的高动态图像编码方案距离图像。
最近,相机行业开始从低动态范围(LDR)图像过渡,使用传统的RGB颜色8位表示,高动态范围(HDR)图像,使用更高位的比特深度来表示每个RGB颜色。传统的PEG(L -PEG)标准(ISO/IEC 10918)主导LDR图像编码市场,但不提供对HDR图像的支持。为了解决这个问题,JPEG委员会(ISO/IEC JTCL SC29 WG1)发起了一种新的HDR图像编码标准化,称为JPEG XT(ISO/IEC 18477),它提供了L-JPEG向后兼容性[5]。在JPEG XT中,HDR图像被编码成基本层和残留层码流。输入HDR图像被色调映射到LDR图像,其由L-PEG编码器压缩,并且构建基本层码流以提供L-PEG向后兼容性。残留层码流允许残留层解码器重建一个LDR码流的HDR版本。于是提出了一种新的JPEG向后兼容的HDR图像编码方法。由于产生的离散余弦变换(DCT)域中的残余数据,不同于现有的JPEG XT配置文件,在空间域中生成它们的残差图像。所提出的编码器基于L -PEG编码LDR版本预测输入HDR图像的DCT系数。因此,在我们的编码结构中不需要逆DCT处理,这减少了编码时间。使用各种样本图像的实验结果表明所提出的方法在编码时间和客观和主观评价方面的优越性[6]。
人类可以感知到-CD/m2的动态亮度范围,但是使用传统的每RGB颜色8比特表示的传统数字图像的动态范围被限制在大约[7]。幸运的是,照相机行业已经开始从低动态范围(LDR)图像到高动态范围(HDR)图像的转换,其中每个RGB颜色由较高的比特深度表示,例如,12或16比特。显示HDR图像需要高深度的输出设备,但是大多数现有的输出设备只能处理LDR图像。输入和输出设备之间的这种不平衡预计会持续很多年。在现有显示器上显示的HDR图像的当前解决方案是使用色调映射算子(TMO),将HDR转换为LDR图像[8]。
在图像编码方面,传统的PEG(L -PEG)标准(ISO/IEC 10918)占据了摄影市场。然而,该标准不提供HDR图像的支持。虽然先进的图像编码标准如JPEG 2000(ISO/IEC 15444)或JPEG XR(ISO/IEC 29199)支持HDR图像,但它们对HDR图像编码的接受尚未被市场接受。JPEG委员会(ISO/IEC JTCL SC29 WGL)认识到这是由于缺乏对L -PEG的向后兼容性,L -PEG已经在市场上建立了工具链,并在2012次巴黎会议上发起了一个新的标准化,称为JPEG XT(ISO/IEC 18477)[9]。
其次是基于JPEG压缩而失真的图像的无参考客观图像质量评价。
(IQA)指的是自动估计一个可能扭曲的图像的质量,由人类主体感知的任务。基于参考图像的可用性,IQA方法已被分为3类:全参考(FR)、约简参考(RR)和无参考(NR)IQA。完全没有关于参考图像的信息使得无参考 IQA在IQA方法中最具挑战性。所以将注意力集中在由于JPEG压缩而失真的图像的NR的IQA上[10]。
在包括JPEG在内的大多数压缩标准中,使用的基于块的变换编码会导致块效应,从而降低图像质量。反过来可以采用一个可靠的块度测量,例如,在H.264/AVC的内环路去块滤波器和即将到来的HEVC中,来提高图像质量和编码效率。在空间域和变换域中,已经提出了许多JPEG图像的NR IQA模型[11]。通过测量人类视觉系统(HVS)的特性,通过局部空间特征加权的边缘伪影,提出了一种广义的块边缘损伤度量。另外还有将失真图像建模为干扰块状信号的非块状图像。利用视觉掩蔽模型集成的块状信号的功率最终被用作NR IQA测量。其他的通过提取感知相关特征并在主观数据库上进行训练,提出了一种JPEG压缩图像的NR IQA度量方法。该模型采用5个经验参数,实际性能依赖于训练集。还有利用Sobel算子分别捕获块边界像素和剩余像素的亮度变化,最后结合估计块度。一些人提出了一种利用图像的边缘方向信息来测量块效应的算法,而另一些人通过将局部基于像素的失真与通过视觉掩蔽模型测量的局部可见度相结合来计算块效应[12]。
在变换域方法中,提出了一种在DCT域中工作的块效应的NR测度;首先通过检测2D阶跃函数来定位块效应,然后采用基于人类视觉的阻断损伤测量。另外还有使用二维DFT推导出水平和垂直块度测度,然后采用策略来汇集这两个方向性度量。同样地,试图通过计数由质量相关图加权的零得出DCT系数来区分压缩场景,从而区分自然发生和压缩引起的平坦块。所提出的度量在数学上是不明确的,从某种意义上说,得分范围不是预先确定的,这意味着只能相对地估计质量。此外,大多数现有算法采用两阶段框架,首先通过检测和量化作为图像压缩的结果容易产生的缺陷,然后使用HVS掩蔽来使模型在感知上相关。例如,分别使用DCT域建模和切比雪夫力矩测量块伪影,其次是HVS掩蔽的第二阶段。其中提出了一个NR IQA度量,它直接面向那些导致视觉烦恼的阻塞人工智能,并没有明确地结合人类视觉系统的特性。这个度量值范围被固定在0到1的刻度上[13]。
图像处理当前面临的主要任务是研究新的处理方法和构造新的处理系统,以开拓更广阔的应用领域。
1.2 数字图像处理
数字图像处理技术(digital image processing)通常通过计算机或者硬件处理,也可称为计算机图像处理(computer image processing),其优点是处理的精确度高、内容丰富还可处理复杂的非线性,能灵活地变通。一般来说只要改变软件就可以改变处理内容,缺点是处理速度还有待提高,特别进行复杂的处理更是如此。完整的数字图像处理从总体上可以分为以下几个方面:图像信息的获取,图像信息的存储,图像信息的传送,图像信息处理及图像信息的输出和显示。概括的说数字图像处理主要包括以下几项内容:几何处理(geometrical processing),算数处理(arithmetic processing),图像增强(image enhancement),图像复原(image restoration),图像重建(image reconstruction),图像编码(image encoding),图像识别(image recognition)及图像理解(image understanding)[14]。
1.2.1 数字图像处理内容
接下来对以上的几项内容做详细的介绍:
首先几何处理包含简单的坐标的变换,图像放大和缩小、旋转、移动等,还有复杂一点的扭曲校正,计算周长、面积、体积等。其中一个重要的处理方法是图像配准,由于几何算是数学范畴,所以会涉及到许多数学问题。几何处理在医学中对各种器官的照片图案处理中,起着非常重要的作用。
算数处理也属于数学领域,它的主要方式是对图像作加、减、乘、除等运算,虽然算数处理的作用点在于像素点,但是非常有效。
其中图像增强一方面,即对人们感兴趣的信息进行强化,对不使人感兴趣的部分信息作减弱处理。目的就是突出重点,加强有用的信息,可以让人更直观地看到其中的区别。
图像复原顾名思义是还原图像质量,影响图像质量的主要是干扰和模糊,最典型的还有去噪。图像噪声包含随机噪声和相干噪声,随机噪声从图片上看是麻点干扰,相干噪声从外观辨认的特点是网纹,复原处理还有一项任务是去模糊也,这些模糊的原因有多种,比如大气湍流、云层遮挡、透镜散焦、相对运动等。干扰可用维纳滤波,逆滤波,同态滤波等方法除去[16]。
图像重建主要是利用一些数学算法,如迭代法、代数法、卷积反投影法、傅里叶反投影法等。比较来看,因为运算量小、速度快,所以卷积反投影法运用最广泛。另一方面值得注意的是,由于与计算机图形学结合,由多幅2D图像可以合成3D图像,由此看出三维重建算法也发展很快。三维图形主要利用的算法有实体法,彩色分域法,线框法,表面法等。三维重建技术是当下非常热门的一项技术,也成为了虚拟现实和科学可视化技术的基础。
信息论中涉及图像编码的知识,属于对信源的编码。主要是利用图像信号的统计结果进行整理和缩减长度。达到对对图像信号进行高效编码的目的,如本次设计要提到的行程编码,将大量连续数据压缩,数据压缩通常在传输之前采用图像编码来解决数据量大的这一矛盾。通常情况下的目的有三个:压缩信息量,降低数据率,减少数据存储量。
大体上,模式识别方法有三种,分别为模糊识别法,句法结构识别法和统计识别法。模糊识别法是利用模糊数学的概念和理论然后把它用在识别处理上,在识别处理中着重考虑人的主观概率。句法识别法的侧重点是结构和基元,统计识别法是侧重点是特征。其中模糊识别法当前正处于研究阶段,方法还不够成熟。
图像理解是图像识别的引申和发展。当我们理解一幅图像时输入的是图像,输出的则是一种描述。结果的表达不仅仅是单纯通过符号做出描绘,更是要利用所掌握的客观规律使计算机来进行人性化的联想或者推论,继而理解图像所显示的内容。在这一领域中,还有待人们进一步地挖掘和研究。
总体上讲,多年的发展后的图像处理,已经从以前定义的静止图像已经过渡到了动态图像,以前的二值图像发展到了彩色图像,客观图像发展到现在的主观图像,二维图像进化到如今的三维图像。特别是在图像处理与计算机图形学的结合之后,已经能生产出高保真的及更加有创造性的图像。而由此派生出来的新一代技术的发展,在未来或许能改变社会文化和生产方式。
第二章 图像处理基本原理
2.1图像压缩基础
图像压缩是根据人眼对信息的选择性和心理学决定的,图像的基本要求是清晰度和完整度。在图像完整的前提下,为了方便在有限带宽内进行传输,对数据量惊人的原始图像进行压缩和编码,为了在网络时代做到图片随处可见。所以多年来的图像压缩技术形成一套完整的理论体系。其技术基础是对原图像进行变换,量化,编码等一系列的操作,压缩数据通过信道传输到终端。然后再将以上步骤都反过来操作,即可完成图像解压缩。
原始图像存在很多种信息的冗余,即编码冗余,空间冗余,时间冗余和其他不相关的信息。冗余即多余的,所以这些多出来的图像信息不会被人眼捕捉,我们称为“视觉不相关”,而且在传输中影响效率。
2.2 JPEG标准
静止图像标准是由国际标准组织(ISO)下属的制定静态图像压缩标准的委员会协同摄影专家组制定。1992年,制定出了一套国际标准静态图像压缩标准。目前静止图像编码采用的是JPEG标准,是由国际标准化组织ISO、国际电话咨询委员会、国际电工委员会IEC联合组成的图像专家小组共同定制的[14]。用户可以对任何尺寸的原始图片进行JPEG压缩,同时JPEG也不受形状、颜色以及空间的限制,压缩性可以达到目前技术能实现最好效果。
绝大多数是基于DCT的顺序编码模式JPEG中,在网络占有率高达95%的图像。首先,RGB图像通常被转换成Y空间。然后将每个信道划分为8×8像素子块,并将离散余弦变换(DCT)应用于每个块[15]。对于大多数图像,DCT具有接近最佳的能量紧致性,这意味着大部分信息被存储在一些低频系数中(因为图像倾向于缓慢变化)。在这64个系数中,一个具有零频率的系数称为“DC系数”和另外63个“AC系数”。直流项描述图像块的平均值,而AC系数占较高的频率。
由于较低的频率具有更重要的图像信息,因此通过应用量化步骤来选择性地压缩频率信息,该量化步骤基于适当定义的量化表,更精确地量化更高的频率,同时保持较低的频率。量化后,对DC项进行差分编码,而AC系数以Z字形的方式对每个块进行排序,并进行行程编码。最后,这两个部分都是霍夫曼编码,以达到最大限度地压缩。
JPEG基本系统如图2.1。
图2.1 JPEG基本系统
2.2.1颜色模式转换及分块采样
由于对一整幅图像进行变换会导致信息的严重缺失,表现为块效应,所以要将每个信道分为8×8像素子块,然后进行分块处理。RGB图像通常被转换成Y空间。Y代表亮度,、代表色度、饱和度,也称为YUV系统。
公式如下:
以上是毕业论文大纲或资料介绍,该课题完整毕业论文、开题报告、任务书、程序设计、图纸设计等资料请添加微信获取,微信号:bysjorg。
相关图片展示:
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。