论文总字数:25911字
摘 要
随着科技的发展,工业系统也越来越复杂化,对于工业系统整体流程的建模也是越来越困难,而基于数据驱动的故障检测方法可以将大量高质量的过程数据用于过程的优化和监控。给水泵是电站锅炉的重要辅机设备之一,其工作状况对整个机组的安全和经济运行具有重要的影响。为此,研究给水泵的状态监测方法具有重要的理论意义和实用价值。
本文对数据驱动多元统计方法中使用较多的三种主成分分析法进行了深入探究,用经典过程—田纳西伊斯曼过程(Tennessee Eastman process,TEP)进行仿真实验,分析三种方法的检测效果,最终选用自适应阈值的主成分分析法进行给水泵的故障检测。由于缺少给水泵的故障数据样本,先从给水泵的测点中选出能够反应给水泵主要状态的参数数据构成训练模型,再在此基础上构造故障数据,最后使用自适应阈值的主成分分析方法对给水泵进行故障检测。这样就可以对给水泵的运行状态进行实时的监控,对发生的故障进行及时有效的处理,提高机组的运行稳定性。仿真结果显示,自适应阈值主成分分析法在给水泵故障检测中有较高的故障检测灵敏度和正确率。
关键词:给水泵;故障检测;主成分分析;自适应阈值
Abstract
With the development of science and technology, industrial systems are becoming more and more large and complicated. It becomes more and more difficult to model the whole process of industrial system. The data-driven fault detection method can utilize large number of high-quality process data to monitor and optimize the process. Feed water pump is one of the important auxiliary equipment of the power plant. Its working condition has an important influence on the safety and economic operation of the whole unit. Therefore, it is of great theoretical and practical value to study the state monitoring method of feed water pump.
This paper analyzes three kinds of principal component analysis methods which are popular in data-driven method, and the simulation results of three methods are analyzed through the classical process-Tennessee Eastman process (TEP). Finally, adaptive principal component analysis method is selected to detect the fault of the feed pump. Because of the lack of the faulty data of the water pump, the state parameter data of the water pump can be selected from the measuring point of the feed pump to form the training model, and then the fault data is constructed. At last, the adaptive threshold principal component analysis method is used to detect the feed pump. So that the real-time monitoring of the operation of the pump can be realized. The operators can timely and properly handle the sudden and gradual changes in the occurrence of failure. The power plant can improve the safety of the feed pump. The simulation results show that the adaptive threshold PCA method has high fault detection sensitivity and correct rate in the water pump fault detection.
Keywords: feed pump; fault detection; principal component analysis; adaptive threshold
目 录
摘 要 I
Abstract II
第一章 绪论 1
1.1选题背景及意义 1
1.2基于数据驱动的主成分分析方法研究现状 1
1.3本文主要研究内容 2
第二章 主成分分析方法故障检测仿真实例分析 3
2.1主成分分析方法(PCA) 3
2.1.1基本主成分分析法(PCA) 4
2.1.2动态主成分分析法(DPCA) 7
2.1.3自适应阈值主成分分析法 9
2.2田纳西伊斯曼过程(TEP) 12
2.3故障检测方法在TEP的应用 15
2.4主成分分析方法检测性能比较 16
2.5本章小结 22
第三章 基于自适应阈值主成分分析法的给水泵故障检测方法研究 23
3.1火电厂给水泵简介 23
3.2给水泵故障类型和参数的选择 24
3.2.1给水泵的故障类型 24
3.2.2给水泵的运行状态参数的选择 24
3.3给水泵故障检测数据生成 25
3.3.1给水泵训练数据 25
3.3.2给水泵故障数据 25
3.4给水泵故障检测性能分析 28
3.5本章小结 34
第四章 结论 35
4.1本文主要研究成果 35
4.2待解决的问题 36
致 谢 37
绪论
1.1选题背景及意义
随着中国一步步淘汰中小容量机组,现在我国的机组主要是30,60,100兆瓦的机组,机组容量的增加就意味着工质温度和压力的增加,而给水泵作为给流动工质升压的最主要设备,它的运行状态的稳定性对机组的安全,经济运行有着很大的影响。所以如果要提高机组发电的经济性,提高发电量和发电效率,就需要机组在全负荷下运行,这就需要给水泵时刻保持稳定运行,一般电厂会在运行的给水泵之外准备一台备用给水泵能够在运行给水泵发生故障时,迅速地切换到备用给水泵。在以往的给水泵检修中,给水泵系统大多是与机组的大修同步进行,但是由于给水泵一直处于高温高压高转速的条件下运行,给水泵可能会发生突发性的故障,这种突发性的故障可能导致机组停机的事故,造成非计划停机小时数的增加,降低电厂的经济效益。
对于发电厂这种大规模和复杂的系统,数据驱动分析方法被越来越多地使用在故障检测和诊断中,通过检测异常操作过程存在的时间和诊断异常来源来改进过程操作。基于多变量统计分析的常见方法得到了广泛的使用,特别是主成分分析法(Principal Component Analysis,PCA)。主成分分析法可以和故障检测指数(包括T²统计量和称为Q统计量的预测误差平方)结合使用来进行故障检测。故障检测技术改变了给水泵的维修方式,利用有效的状态监测技术,实时地监测给水泵的运行状态,及时发现突发性的故障,并对设备进行维护,这样就可以降低设备故障造成的停机损失,提高机组的运行时间和运行效率,最大程度地提高经济效益。
1.2基于数据驱动的主成分分析方法研究现状
主成分分析(PCA)方法最初由Pearson[1]在1901年提出,后来由Hotelling[2]进行改进,它是一种线性最优降维工具,它考虑了过程变量之间的相关性,并捕获了数据中的最大变化,现在这种方法被广泛使用在工业过程监控中。
为了改进在线故障检测和自适应监测技术,一些学者提出了移动窗口主成分分析法(MW- PCA)和递归主成分分析法(R- PCA)。当所建立的故障指示器超过固定阈值时,可以检测到过程数据的变化。阈值是基于监测质量的经验分布来设定的,因此,用给定的置信水平来确定阈值。固定阈值影响误报率(False Alarms Rates,FAR)和漏检率(Miss-Detection Rates,MDR)之间的平衡。
Russell et al.[3]演示了在田纳西州伊斯曼过程中使用PCA,动态主成分分析(Dynamic PCA, DPCA)和规范变量分析(Canonical Variate Analysis,CVA)进行故障检测。由于误报率高,他们选择只有当六个连续统计值超过控制限时,过程才发生了故障,但是该规则将实际检测时间延迟五个样本,这样就大大降低了故障的检测率。Detroja[4]等人也使用这种故障判别的方法,他们通过PCA,DPCA和对应分析(Correspondence Analysis,CA)方法对全厂系统进行检测和诊断。Tamura和Tsujita[5]在研究保留的主成分数量对使用PCA的故障检测方案的灵敏度的影响时也使用了这一方法。
Wang et al.[6]引入时间显式Kiviat图,他是将化学过程中收集的多维时间序列的数据在图中表示出来,在两个连续的样本被认定为故障时才算发生了故障。
Zhang[7]提出了一种改进的内核独立分量主成分分析法(Kernel Independent Component Analysis,KICA),这种方法适用于非线性过程的故障检测和诊断。
然而,基于固定阈值的检测都会增加误报或漏报的数量,使得这些技术在实践中不适用。为了克服这些方法的缺点,一些学者在PCA方法的基础上提出了自适应阈值的主成分分析法。
1.3本文主要研究内容
本文以汽动给水泵为研究对象,先对主成分分析法(PCA),动态主成分分析法(DPCA),以及自适应阈值的主成分分析法进行研究,分析他们的原理方法和故障检测步骤,并将三种方法在TEP中进行仿真,比较三者的检测性能的优劣,然后提取给水泵中能反应给水泵运行状态的重要参数的数据,并构造给水泵故障测点的数据,再以自适应阈值的主成分分析法进行给水泵的故障检测过程,实验表明,此方法取得了良好的效果。本文的主要研究内容如下:
(1)第1章主要介绍了相关背景和进行给水泵故障检测的意义以及主成分分析法的研究现状,对现在的研究方法的缺陷进行了介绍。
(2)第2章主要介绍了三种主成分分析方法(PCA,DPCA,自适应阈值主成分分析法)的原理,公式,计算步骤,以及诊断的流程图。然后介绍了田纳西伊斯曼过程(TEP)的系统构成,过程数据和故障类型,以及三种主成分分析法在TEP中的仿真应用,比较三种方法的故障检测性能的优劣(误报率FAR,漏报率MDR和检测延迟Detection Delay)。
(3)第3章主要介绍了汽动给水泵的主要结构,根据给水泵的实际测点表,选择给水泵的主要输入输出参数用于建模。导出的测点数据用于建立训练模型,并在此基础上分析给水泵的故障数据,并用于给水泵的故障检测。分析自适应阈值主成分分析法对于给水泵故障检测的性能,检验这种方法的可靠性和有效性。
(4)第4章总结了本文的主要研究成果,并指出工作中的不足,对后一步的工作提出建议。
主成分分析方法故障检测仿真实例分析
在过去几十年中,快速的技术发展已经导致现代工业过程和自动控制系统日益大型化和复杂化,这使得系统过程的检测面临日益增长的挑战,这也对可靠性,安全性,产品质量和最优化操作提出了更高的要求。检测技术通过利用隐藏在测量中的可用信息来分析系统的运行状态。此外,数据分析应用于早期检测,可以在系统损坏之前对新出现的问题提供非常重要的警告提示。多元统计方法就是其中一种方法,它确定了几个导致大部分的过程变化的独立变量,并且已成功应用于各种系统的故障检测和诊断。多元统计方法包括主成分分析法,偏最小二乘法和独立分析法等方法,而主成分分析法是发展比较成熟也是使用较广泛的方法。
2.1主成分分析方法(PCA)
主成分分析法(PCA)方法最初由Pearson[1]在1901年提出,后来由Hotelling[2]进行改进,PCA方法可以提取并且标准化过程正常状态下的大量数据,从中提取能反应过程的主要特征,建立主元模型。在线故障检测时,当实时的数据不能与主元模型符合时,即可判断出有故障发生在系统中。PCA的优点在于不需要知道和建立系统的具体精确的模型就可以进行系统的故障检测。
但是在传统的主成分分析方法中,假定的是在某一时刻的观测值与过去时间的观测值无关,即在实际过程中没有讨论数据的串行相关性。然而,实际过程数据通常是时间序列相关的,这需要对观察变量进行扩展,即不仅包括当前观察值,而且还包含过去时刻的观察值。所以这就发展出了PCA的改进方法—动态主成分分析法(DPCA)。在DPCA中,将可变延迟添加到数据阵列中,构建时滞数据矩阵,消除数据序列相关。DPCA方法考虑了数据时间序列的相关性,所以这种方法对含有时滞数据系统的故障检测有很好的效果。
而不管对于PCA还是DPCA,他们所使用的都是固定阈值,固定阈值会增加误报和漏报的数量,使得这些故障检测方法在实际应用中的检测准确度不高,在实践中并不适用。为了克服这些方法的缺点,Bakdi[10]等人结合PCA统计的特征和修改的指数加权移动平均(Exponentially Weighted Moving Average,EWMA)方法提出了一种新的自适应阈值方案。EWMA最初由Roberts[11]提出的是一种常用的序列数据处理方式,对于时间越久远的数据给与越少的权重,用这样的方法来加权平均数据,因此时间过久的数据则会被及时地去除。自适应阈值经过调整来适应构造的PCA模型,通过对最近的样本进行适当加权来消除噪声的影响。
本节将利用上述的三种PCA方法(PCA,DPCA,自适应阈值主成分分析法)针对典型算例(TEP)开展对比仿真研究,为给水泵故障检测方法的选择提供依据。
2.1.1基本主成分分析法(PCA)
数据驱动的监测方法在现代工业过程中是高效的,由于它们的降维能力,可以用于复杂和大规模的工业过程。例如,PCA方法已经收到越来越多的专注,并用于故障检测和过程监控。它是基于从过程观察获得的大数据集提取的有用信息来建立的模型。本节介绍使用PCA进行故障检测的一般过程[12]。
(1)使用PCA方法的模型框架
使用PCA方法的模型框架主成分分析是最常用的基于数据的多变量统计分析方法。 PCA将经常包含大量高度相关的过程变量的测量数据投影到不相关的主成分的较低维空间中,描述过程的大部分变化。
选择监控变量,收集正常工况下的各变量的样本,设训练样本数据为。
(2-1)
式中,为n×m矩阵,即n个样本,m个观测变量
对样本数据进行中心化和标准化处理得到Xb
中心化处理:按列对减去观测变量的均值
(2-2)
式中,为第i行第j列的采样值,为第j列的平均值
(2-3)
即求取一列的平均值
标准化处理:对除以观测变量的标准差
(2-4)
(2-5)
式中,为第j列的标准差,为中心化标准化后的中的第i行第j列的值
在将数据矩阵统一变为具有零均值和单位方差的矩阵 之后,PCA确定最佳线性变换如下:
(2-6)
式中,S是的协方差矩阵,并通过奇异值分解
(2-7)
式中,是加载矩阵,是与协方差矩阵的特征值相关联的正交特征向量,并且是具有递减顺序的对角特征值矩阵。
(2-8)
式中, 是主成分分数矩阵。
保留个主元(Principal Component,PC),不同的矩阵被分解为以下形式:
(2-9)
式中,是前个特征值所对应的特征向量,是余下的特征向量。
剩余内容已隐藏,请支付后下载全文,论文总字数:25911字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;