基于二维EMD的图像融合方法研究

 2022-01-17 23:20:22

论文总字数:15949字

目 录

摘要 I

Abstract II

绪论 1

1 图像融合的分类 3

2 图像融合的方法 4

2.1 简单的图像融合方法 4

2.2 基于PCA的图像融合 5

2.3 基于HIS变换的图像融合 5

2.4 金字塔图像融合算法 5

2.5 基于小波变换的图像融合 6

3 经验模态分解基本原理 6

3.1 一维经验模态分解原理 6

3.2 一维经验模态分解实例 10

4 经验模态分解的复杂扩展 11

5 二维EMD图像分解与融合 12

5.1 二维经验模态分解过程 12

5.2 基于二维EMD的图像融合 13

6 实验结果及分析 14

7 结论 23

参考文献 24

致谢 25

基于二维EMD的图像融合方法研究

黄西西

, China

AbstractImage fusion is an important part of image processing. It refers to the image data of the same observation object that will be obtained through various methods such as multiple channels, and then through some technical means, such as through computer image processing techniques, the largest Cheng Shang obtains the most favorable information for the observation objects obtained from different channels. Finally, the images are merged into a new high-quality image to make full use of the information in the original image, which is more conducive to the observation and application of the target. The application of the Empirical Mode Decomposition (EMD) algorithm is completely dependent on data and can be used to handle adaptively decomposed nonlinear non-stationary signals. In this paper, based on the empirical mode decomposition algorithm, image fusion simulation experiments of visible light and infrared light images are performed. The image fusion is performed using the mean squared weighted coefficient fusion method. Standard deviation, information entropy, average cross entropy, mean square cross entropy, etc. are adopted. The indicators evaluate the fusion results. Image simulation results show the effectiveness of the image fusion algorithm based on BEMD.

Key words:Image fusion; Empirical mode decomposition;IMF component ;Image simulation

绪论

图像作为一种视觉信息,自古以来就是人类获取信息的主要途径,因为相比于文字、声音等形式的信息载体,图像所包含的更丰富和更直观的信息更容易人类被观察者接受。据数据统计,图像信息大约占据人类所获取信息的百分之七十五[1][1]。

经过科学的研究分析发现,强烈的互补性和很大的冗余性是数量巨大的图像数据之间的特点,尤其是对于通过不同方式获得的同一观测目标的图像数据。如何从这些互补的、冗余的多通道和大规模数据中有效地提取出更有价值、准确、高质量的图像信息,为人类生存发展和社会进步提供更好的服务,这已成为一个亟待解决的重要问题。正因为如此,图像融合技术的研究已经成为一个热门话题[2][2]。

将多幅图像通过某种方法进行融合并得到一张新的图片,它包含所有融合图像的显著特征,融合后的图像能够更好地体现所要观察目标的细节等信息[3][3]。融合技术尤其适用于很难获得所有相关对象都是“焦点”的图像,而多个“非焦点”图像必须结合在一起才能产生一个单一的“聚焦”图像。在静态场景中,可以得到数量众多的多曝光图像,这需要在一个大范围的亮度/辐照度限制相机捕捉一个镜头的所有特征的时候。在这种拍摄条件下,有些区域会被过度曝光或曝光不足的问题会经常发生。这些过度暴露的区域通常比那些暴露在光线下的区域的信息更少,因此需要融合。对于多个图像的融合,通过某种融合方法,先将图像分割成几个不重叠的块来完成“局部”的融合。之后,选择包含较多信息量的图像块进行图像融合。利用这种方法,Goshtasby提出了熵作为多重曝光图像融合的信息测度[4][4]。然而,该技术并没有对输入信号(多尺度融合)的多个自然频率尺度下的分解图像进行局部融合,因此是次优的。

在已知的多幅图像融合技术中,主要是利用图像的一些信息测度,结合输入图像的多尺度分解。多分辨率小波变换通常用于提供所需的分解,在此之后,分解信号对应的系数被方便地组合成融合图像的系数[5][5]。由于已知图像融合系数,利用小波逆变换的处理方法,便可以使融合图像得曝光效果比较好。最近还通过离散的cosine transform (DTC)域实现了融合[6][6]。然而,在傅里叶域中,这些技术无法在“局部”层面上提取图像的细节,因此无法在本地进行融合,这是由于它们的非自适应性质。此外,傅里叶分析和DCT对正交正弦信号的输入信号,无论输入数据的性质如何;而小波也基于将输入信号投射到某些固定的先验基函数上,使得这些问题都会使得这些方法在处理非平稳信号时具有局限性。由于真实世界的图像通常是非线性和非平稳的,因此需要一种完全自适应的方法来进行融合。

相关领域中提出利用经验模式分解(EMD)算法来处理非线性和非平稳信号,对非线性和非平稳信号进行自适应分解[7][7]。EMD算法的完全自适应和数据驱动特性使其优于其他已建立的信号处理工具(傅立叶、小波分析),它利用固定基函数的投影来分解输入信号。在[8][8]中,利用EMD理论融合视觉和热图像,其结果要好于小波和基于PCA方法所融合的图像。然而,由于EMD的经验性质,不能保证从两个来源获得相同数量的IMFs,这使得“按照比例缩放”比较困难。而且,即使生成了相同数量的IMFs,也不可能使用实值EMD来将相似的频率模式与不同的源进行匹配。Looney和Mandic使用EMD的双变量扩展[9][9]来解决这个唯一性问题,以在融合多聚焦图像的情况下同时处理两个图像。这样,两个原图像产生的IMFs不仅数量相同,而且两个图像的频率尺度都是在单个复杂的IMFs中对齐的,这样可以更好地比较输入数据的相关标量图像。

在这一工作中,我们建议使用经验模式分解算法的复杂扩展来同时实现多个图像的“多尺度”和“局部”融合。为此,我们对于灰度级和RGB的彩色图像,各自采用不同的融合方法,对这两种图像进行单独融合。通过对真实世界多曝光图像的仿真,将所提出的方案的结果与基于标准小波的融合方法进行比较。

1 图像融合的分类

据融合处理图像水平的高低,图像融合的水平可以划分为三个层次,他们分别为像素级(Pixel-level),特征级(Feature-level)和决策级(Decision-level)。

(1)像素级

相对于特征级图像融合和决策级图像融合,像素级图像融合最基础的融合方式,信号级图像融合是像素级图像融合的另一种称谓,它是先对原始图像的空间进行匹配,然后再对空间匹配的图像采用某种融合规则进行融合,从而生成新的符合一定要求的融合图像。

像素级图像融合方法虽然是相对水平最低的融合,但是根据此方法处理以后得到的图像也有一定的优点,比如具有原始图像更多的细节信息,如边缘、纹理的提取等。像素级图像融合的优点是独一无二的,它可以显示更多的潜在目标,这一特点有利于对图像做进一步的后期的分析、处理工作,经过像素级图像融合处理过后的图像,包含更多关于原始图像的信息,有助于判断和识别潜在的目标,有利于图像中每个像素的操作,使得融合后的图片体现了原始图片的更多内容和图像细节信息。

像素级图像融合方法本身也存在一些不可避免的缺点,因为像素点是像素级图像融合处理时的操作对象,通常来说,有时候一幅图片所包含的信息量是很多的,这就导致了它具有数量众多的像素点,所以在具体实施操作时步骤会很繁多,因而就可能花费相对较多的处理时间。所以很多情况下就会造成融合后图像不能够及时地显示出来,更严重时甚至会导致有些工作无法进行,不能对图像进行融合的情况;像素级图像融合的另一个缺点是容易受到噪声的干扰,影响数据通信,因为像素级图像融合这种方法所要处理的信息量比较大;还有如果直接参加图像融合,而没有将图片进行严格的配准处理,就会不能对融合后的新图像进行有效地信息识别,这是因为融合后的图像中细节不清楚,融合图像所包含的原始图像的信息量较少。

(2)特征级

剩余内容已隐藏,请支付后下载全文,论文总字数:15949字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;