多变量数据驱动的化工过程质量相关故障监测

秦绪光 ,  王雪 ,  陈锋 ,  李磊 ,  宋维燕

现代化工 ›› 2025, Vol. 45 ›› Issue (11) : 231 -236.

PDF (1869KB)
现代化工 ›› 2025, Vol. 45 ›› Issue (11) : 231-236. DOI: 10.16606/j.cnki.issn0253-4320.2025.11.039
工业技术

多变量数据驱动的化工过程质量相关故障监测

作者信息 +

Multi-variate data-driven monitoring method for quality-related faults in complex chemical processes

Author information +
文章历史 +
PDF (1912K)

摘要

以多变量数据驱动为导向,分别对卷积神经网络(CNN)及交叉熵损失函数(CEL)进行改进优化,构建适用于复杂化工过程质量相关故障的监测模型——二维卷积神经网络(2DCNN)及基于类别加权的交叉熵损失函数(WCEL)。该方法能够将多变量数据转化为若干样本矩阵,并以此作为2DCNN模型的输入,分别有效地捕捉矩阵行数和列数所表征的时空维度特征,从而实现高精准的质量相关故障监测;同时,嵌入损失函数——WCEL,自适应地动态调整2DCNN模型的学习率,从而解决故障类别分配不均衡问题。

Abstract

Based on multi-variate data,a monitoring method for quality-related faults in complex chemical processes is proposed.The convolution neural network (CNN) and cross-entropy loss (CEL) function are optimized to establish the two-dimensional convolution neural network (2DCNN) and the weighted cross-entropy loss (WCEL) function,respectively.By this method,multi-variate data can be converted into several sample matrixes,which are further used as inputs for a 2DCNN model that can capture effectively the spatiotemporal characteristics represented by the number of rows and columns in the matrix,thereby monitoring precisely quality-related faults.In addition,WCEL function is embedded to adjust the learning rate of 2DCNN model adaptively and dynamically,thereby solving the uneven problem in allocation of fault categories.

Graphical abstract

关键词

质量相关故障 / 基于类别加权的交叉熵损失函数 / 二维卷积神经网络 / 多变量数据 / 化工过程

Key words

quality-related fault / weighted cross-entropy loss function / two-dimensional convolution neural network / multi-variate data / chemical process

Author summay

秦绪光(1972-),男,硕士,高级工程师,研究方向为石油化工工程项目管理和设备管理,

引用本文

引用格式 ▾
秦绪光,王雪,陈锋,李磊,宋维燕. 多变量数据驱动的化工过程质量相关故障监测[J]. 现代化工, 2025, 45(11): 231-236 DOI:10.16606/j.cnki.issn0253-4320.2025.11.039

登录浏览全文

4963

注册一个新账户 忘记密码

随着化工工艺装置日趋大型化、密集化和一体化,加之生产过程呈现高度非线性与复杂耦合性,造成过程数据海量、繁杂且难以有效处理[1-3]。一旦某个过程变量出现异常波动,容易引发一系列恶性演化事件,甚至导致化工生产链整体中断[4]。其中,质量相关故障是指化工过程变量偏离正常工况而致使生产效率降低、生产产品异常[5]。鉴于此,实时化、精准化质量相关故障监测不仅事关安全性、平稳性工艺运行,还涉及高可靠、高质量化工产出,已成为数智化过程控制领域的研究热点之一。
深度学习技术通过非线性网络层间耦合,感知、学习和预测化工过程数据之间的内在关联规律,适用于提取海量繁杂数据所蕴含的非高斯性、强耦合性及不确定性等复杂特征,满足多工况与多模态故障监测的需求[6-7]。例如,刘子健等[8]提出一种基于数据降维和深度学习的化工故障识别方法,通过生成拓扑映射获取原始过程数据的低维空间表示,并引入长短期记忆网络来学习关键变量集的深层次特征、开展化工过程故障识别。杨余等[9]提出一种基于最小一维卷积神经网络的过程故障诊断方法,通过卷积核学习和识别不同故障类型的数据特征,自动提取优势特征并进行故障分类。肖飞扬等[10]提出一种基于并行长短期记忆和卷积神经网络的化工过程故障检测方法,可有效结合时间序列数据全局和局部特征提取能力,从而减少特征信息丢失、提高故障检测效率。在复杂化工生产过程中,表征质量相关故障的过程数据兼具时间和空间2个维度特征,需要从多维角度处理非线性、时序性和高耦合性问题,以提高故障监测结果的可靠性。然而,上述研究方法大多只考虑温度、压力、流量等过程数据的时间维度特征,而忽略多变量数据交互而衍生的空间维度特征,导致质量相关故障监测结果的有效性差、准确率低。
为此,本文中提出一种多变量数据驱动的复杂化工过程质量相关故障监测方法。首先,通过将卷积层、池化层和全连接层进行重构,建立二维卷积神经网络(two-dimensional convolutional neural network,2DCNN),使得多变量数据以样本矩阵的形式作为输入。其中,矩阵行代表数据样本的长度且用于提取时间特征,矩阵列代表监测变量的数量且用于提取空间特征。2DCNN模型能够充分利用二维卷积和二维池化窗口,以学习多变量数据所包含的时空双维特征,深度挖掘影响质量相关故障的关键时空因素,并据此开展实时化、精准化的化工过程故障监测。此外,引入类别加权,构建一种新的交叉熵损失函数——基于类别加权的交叉熵损失函数(weighted cross-entropy loss,WCEL)。WCEL能够在训练过程中关注验证标签的占比,自适应地动态调整2DCNN模型的学习率,从而防止模型发生过拟合现象,解决故障类别分配不均衡问题,提高质量相关故障监测准确率。

1 基本理论

1.1 二维卷积神经网络

卷积神经网络(convolutional neural networks,CNN)作为一种深度学习模型,主要用于图像、视频、语音等多模态数据分类和识别任务[11]。CNN主要由滤波级和分类级组成。其中,滤波级包含卷积层、池化层和激活层,用来提取输入数据的特征;分类级包含全连接层,即根据所提取的数据特征进行分类[12]
然而,化工生产过程呈现出高度非线性与复杂耦合性,工序与工序、设备与设备、物质与物质之间纵横交织,且级联关系错综烦琐;传统CNN模型通常以时间切片为导向,即在时间轴上将数据展开,并设定窗口使其转换为一段段时间序列,故只能处理单一时间维度特征。为此,本文中将卷积层、池化层和全连接层进行重构,建立一种新的2DCNN模型,如图1所示。该模型能够将原始数据转换为m×n的二维矩阵;其中,m代表数据样本的长度,可视为时间维度,与采样频率有关;n代表监测变量的数量,可视为空间维度,与监控点位有关。此外,该模型包含2个二维卷积层、2个二维最大池化层以及2个全连接层。其中,二维卷积层是核心,通过不同的卷积核对原始数据进行卷积运算,以提取时空维度特征;二维最大池化层则通过下采样对上层所提取的时空维度特征进行解析,并减少下层输入尺寸,以增强特征提取的鲁棒性;全连接层则将上层所提取的高层次特征进行整合,以实现数据分类。需注意的是,在开始训练2DCNN模型时,应设置“批量”参数,将数据样本划分为小批量,从而更为精准地提取原始数据特征;同时,利用随机梯度下降法进行模型训练,即每次小批量求解后,更新神经元的权重和偏差,从而降低训练集和验证集的学习误差。因此,2DCNN模型可对时间和空间的数据信息进行集成化处理,并利用卷积核捕获时空维度特征,从而深度挖掘影响质量相关故障的关键时空因素,弥补传统CNN特征提取单一化的弊端。

1.2 基于类别加权的交叉熵损失函数

交叉熵损失函数(cross-entropy loss,CEL)亦称为对数损失函数,是深度学习算法的常用损失函数,可用于衡量分类模型的性能[13]。如式(1)所示,CEL主要通过调整模型权重来寻找最优解,以减少分类模型内训练值与验证值之间的误差,并向模型反馈与其相关的数据拟合程度[14]
$L(y, \hat{y})=-\sum_{i=1}^{C} y_{i} \log \left(\hat{y}_{i}\right)$
式中,C为类别总数;y为验证类别标签; $\widehat{y}$为模型的训练值;yiy中的第i类元素; ${\widehat{y}}_{i}$y中第i类元素的训练值。
然而,在复杂化工生产过程中,质量相关故障的原始数据样本存在不均衡性,即不同故障类别之间的数量具有差异;传统CEL难以有效处理类别不平衡问题,易致使2DCNN模型偏向频繁类别,造成故障监测结果不准确。为此,本文引入类别加权的理念,构建一种新的交叉熵损失函数——WCEL。如式(2)所示,通过设定类别权重ω,并根据数据集中类别分布情况而自适应动态调整,以解决不同类别间的不平衡性问题,从而对复杂化工过程质量相关故障进行精准监测。
$\begin{array}{c} L(y, \hat{y})=-\sum_{i=1}^{C} \omega_{i} y_{i} \log \left(\hat{y}_{i}\right)= \\ (1 / N) \sum_{n=1}^{N} \omega_{n} y_{n} \log \left(\hat{y}_{n}\right) \end{array}$
式中,ωi为第i类元素的权重;n为分类任务的个数;N为批次内的样本数;ωn为第n类的权重。

1.3 模型性能评价指标

本文中重点将故障诊断率(fault diagnosis rate,FDR)和误识率(false prediction rate,FPR)作为复杂化工过程质量相关故障监测模型的性能评价指标,分别如式(3)、(4)所示。
FDR=a/(a+b)
FPR=c/(c+d)
式中,a为在故障样本A中监测准确的数量;b为在故障样本A中监测为其他类别的数量;c为在其他样本中监测为故障A的数量;d为在其他样本中监测准确的数量。

2 方法步骤

以多变量数据驱动为导向,分别对传统CNN和CEL进行改进优化,构建适用于质量相关故障的监测模型——2DCNN及其相应的损失函数——WCEL,具体建模步骤如图2所示。
步骤1:针对复杂化工生产过程,获取海量、异构的多变量数据(如流量、压力、温度、液位等),并进行标准化处理,使得数据均值、标准差分别为0和1。
步骤2:对质量相关故障的预处理数据进行标注,且标签使用One-hot编码;与此同时,需将编码数据划分为训练集和验证集(即80%训练、20%验证),以提高后续2DCNN模型的综合性能。
步骤3:搭建2DCNN模型结构,涵盖卷积核大小、最大池化层窗口大小、全连接层神经元及激活函数,并将损失函数WCEL嵌入其中,对清洗后的数据样本进行学习训练。
步骤4:为提高质量相关故障的监测准确率,将FDRFPR作为模型性能评价指标,并根据验证集结果不断调整模型参数,以选取性能最佳的参数组合。

3 案例分析

3.1 TEP仿真

依据实际化工反应过程,美国Eastman化学公司开发了具有开放性和挑战性的化工模型仿真平台——田纳西-伊斯曼过程(Tennessee Eastman process,TEP),产生的数据具有时变性、强耦合性和非线性等特征,目前已广泛应用于复杂化工过程的故障检测和诊断[15-16]。如图3所示,TEP主要由反应釜、分凝器、分离塔、汽提塔、再沸器和压缩机等多个操作单元组成。本文中主要对质量相关故障进行仿真,即IDV(1)、IDV(2)、IDV(5)、IDV(6)、IDV(7)、IDV(8)、IDV(10)、IDV(12)、IDV(13),详见表1
在此,将采样频率设置为0.01(即100个样本/h),获取不同故障类型下时序过程数据。针对质量相关故障工况模拟,在正常工况下运行10 h,待TEP稳定后引入相应的过程故障,继续运行38 h;其中,引入故障6后,过程运行7 h终止。此外,为同时提取TEP数据的时间和空间特征,经标准化及标注、编码等预处理后,以1 h为单位划分样本矩阵,将原始数据转化为100×50的二维矩阵;其中,100代表1 h采样100次,50代表50个监测变量。

3.2 模型结构及参数

将上述100×50二维矩阵作为输入,并以8∶2划分训练集和验证集,对本文中所构建的2DCNN模型——Conv2D(64)-Max Pooling-Conc2D(32)-Max Pooling-FC(300)-Dropout(0.5)-FC(9)进行训练。针对卷积层,卷积核尺寸设置为3×3、步长设置为1,并使用Relu激活函数。针对池化层,池化窗口设置为2×2、步长设置为2,同时卷积层和池化层的Padding均设置为“same”,以保证样本矩阵大小不变。针对全连接层,第一层和第二层分别使用Relu和Softmax激活函数,且2层间设置丢失概率为0.5的Dropout层,通过丢弃50%神经元来防止模型过拟合。此外,采用TensorFlow框架搭建2DCNN模型,并嵌入损失函数WCEL,训练批量和训练轮次分别设置为64、80。

3.3 故障监测结果

图4显示了2DCNN模型训练的损失和准确率变化曲线。其中,损失随训练轮次的增加而下降,最终训练集和验证集的损失基本一致且保持稳定;准确率随训练轮次的增加而上升,最终训练集和验证集的准确率亦基本一致且保持稳定。因此,2DCNN模型已得到充分学习和训练。
将2DCNN作为质量相关故障监测模型,并将FDRFPR作为其性能评价指标,结果详见表2。其中,IDV(1)、IDV(2)、IDV(6)和IDV(7)的FDR为100.00%;IDV(10)的FDR最低,为94.65%;平均FDR为98.52%;IDV(1)、IDV(2)、IDV(6)和IDV(7)的FPR为0;IDV(13)的FPR最高,为5.26%;平均FPR为1.48%。因此,2DCNN模型具有较高FDR和较低FPR,即该模型可有效监测TEP所涉及的质量相关故障。

3.4 对比与讨论

选取2个变化规律相似的IDV(1)和IDV(2),并分别将2DCNN模型与传统CNN、LSTM、LSTM-CNN进行性能对比和分析,结果详见表3。其中,CNN具有较高的FDR,但FPR亦较高,说明该模型对二维时序数据的鲁棒性较差,当数据的随机噪声增加时,可能无法准确辨识故障IDV(1)和IDV(2)。LSTM具有较高的FDR,且只有故障IDV(2)的FPR较高,说明该模型对二维时序数据的鲁棒性较好。LSTM-CNN具有较高的FDR,但FPR亦较高,说明该模型不能适配地融合LSTM和CNN的优点,导致其对二维时序数据的鲁棒性最差。针对IDV(1)和IDV(2),2DCNN的FDRFPR分别为100.00%、0.00%,说明该模型具有很好的鲁棒性,即面对高噪声干扰环境时,能够准确辨识出质量相关故障且不会产生误差。
设置2种训练批量——64和128,并分别将2DCNN模型与传统CNN、LSTM、LSTM-CNN进行准确率对比和分析,结果详见表4。当训练批量为64时,2DCNN模型较CNN、LSTM、LSTM-CNN而言,准确率可分别提高10.64%、0.53%、0.05%;当训练批量为128时,2DCNN模型较CNN、LSTM、LSTM-CNN而言,准确率可分别提高8.95%、0.63%、0.56%。由此可见,CNN模型准确率最低,无法精准监测TEP所涉及的质量相关故障;LSTM和LSTM-CNN模型虽具有较好的准确性,但随着训练批量的增加,准确率下降幅度较大,即针对海量过程数据时2种模型将无法保持质量相关故障监测的稳定性;2DCNN模型准确率最高且受训练批量的影响幅度最小,即能够兼顾质量相关故障监测的准确性和稳定性。
分别嵌入损失函数WCEL和CEL,对比其对2DCNN模型性能的影响机制,结果详见表5。针对IDV(1)、IDV(2)、IDV(5)、IDV(6)、IDV(7)、IDV(8)、IDV(12),WCEL的FDR均高于或等于CEL;针对IDV(1)、IDV(2)、IDV(5)、IDV(6)、IDV(7)、IDV(10)、IDV(13),WCEL的FPR均低于或等于CEL。此外,可将上述故障监测结果转化为混淆矩阵,如图5所示。针对IDV(1)和IDV(2)2个变化规律相似的故障,WCEL的FDR均为100%且FPR均为0.00%,说明该损失函数具有很好的鲁棒性;CEL具有较高的FDR,但FPR亦较高,即存在误报现象;由此可见,WCEL的权重策略能够解决样本分布不均匀的问题。针对故障IDV(8)和IDV(12),WCEL牺牲了部分FPR而换取更高的FDR;同样地,针对故障IDV(10)和IDV(13),WCEL牺牲了部分FDR而换取更低的FPR;由此可见,WCEL需进行性能置换,以处理分类任务中标签分布不均匀性。总体而言,利用WCEL所训练的2DCNN模型可获取较高的FDR和较低的FPR,从而实现质量相关故障的准确识别及监测。

4 结论

(1)建立了一种多变量数据的复杂化工过程质量相关故障监测方法。该方法能够将多变量数据转化为若干样本矩阵,并以此作为2DCNN模型的输入,分别有效地捕捉矩阵行数和列数所表征的时空维度特征,从而实现高精准的质量相关故障监测;与此同时,嵌入损失函数——WCEL,自适应地动态调整2DCNN模型学习率,从而解决故障类别分配不均衡问题。
(2)以TEP为例进行验证分析,结果表明,上述方法的平均准确率可高达98.52%,平均误识率可低至1.48%,即能够有效监测TEP所涉及的质量相关故障。相较于传统CNN、LSTM、LSTM-CNN模型而言,2DCNN模型能够在高噪声干扰环境中准确辨识出质量相关故障且不会产生误差,同时可在海量数据驱动时兼具质量相关故障监测的准确性及稳定性。相较于传统CEL而言,利用WCEL所训练的2DCNN模型获取了较高的故障诊断率和较低的误识率,即提高了质量相关故障监测的可靠性与准确率。
(3)本文中所提出的方法属于有监督学习,需要对多源过程数据进行标注;未来可进一步结合无监督学习算法,对质量相关故障监测模型进行优化改进,扩大应用范围并提升应用效果。

参考文献

[1]

秦艳, 徐一凡, 杨燕霞, . 基于最小路径覆盖算法的化工过程重要参数的识别[J]. 现代化工, 2019, 39(4):202-206.

[2]

崔劲松, 贾波, 李学盛, . 化工过程预警的CNN-LSTM耦合模型研究[J]. 过程工程学报, 2024, 24(8):937-945.

[3]

李鑫妮, 王亚君, 许晓婷. 基于AOA优化SVM的工业过程故障检测[J]. 现代化工, 2024, 44(S2):343-347.

[4]

程福松, 侯磊, 周亚云. 石油化工生产区域多米诺效应定量风险分析[J]. 油气储运, 2016, 35(5):457-464.

[5]

宋晓云, 田文德, 靳满满. 非稳态过程故障诊断方法研究[J]. 现代化工, 2016, 36(8):182-185.

[6]

陈文静, 代长春, 党亚固, . 基于DA-CycleGAN的化工过程多工况故障诊断方法[J]. 过程工程学报, 2024, 24(5):618-626.

[7]

张祥, 崔哲, 董玉玺, . 基于VAE-DBN的故障分类方法在化工过程中的应用[J]. 过程工程学报, 2018, 18(3):590-594.

[8]

刘子健, 贾旭清, 张士发, . 基于数据降维和深度学习的化工故障识别[J]. 控制工程, 2021, 28(10):2005-2011.

[9]

杨余, 杨鑫, 王英, . 基于mini-1D-CNN模型的TE过程故障诊断[J]. 中国安全科学学报, 2023, 33(2):173-178.

[10]

肖飞扬, 顾幸生. 基于并行LSTM-CNN的化工过程故障检测[J]. 华东理工大学学报:自然科学版, 2023, 49(3):382-390.

[11]

张继旺, 王雪莉, 谢海博, . 基于CNN的旋转叶片缺陷诊断方法[J]. 油气储运, 2020, 39(12):1367-1372.

[12]

Ren H, Liang X J, Yang C H, et al. Spatial-temporal associations representation and application for process monitoring using graph convolution neural network[J]. Process Safety and Environmental Protection, 2023, 180:35-47.

[13]

Guo Q W, Wang C T, Xiao D Q, et al. A novel multi-label pest image classifier using the modified Swin Transformer and soft binary cross entropy loss[J]. Engineering Applications of Artificial Intelligence, 2023, 126:107060.

[14]

Xue Y L, Jin G D, Shen T, et al. Template-guided frequency attention and adaptive cross-entropy loss for UAV visual tracking[J]. Chinese Journal of Aeronautics, 2023, 36(9):299-312.

[15]

Qin R S, Lv F Y, Ye H W, et al. Unsupervised transfer learning for fault diagnosis across similar chemical processes[J]. Process Safety and Environmental Protection, 2024, 190:1011-1027.

[16]

Han L, Gao H H, Xu Y, et al. Combining FAP,MAP and correlation analysis for multivariate alarm thresholds optimization in industrial process[J]. Journal of Loss Prevention in the Process Industries, 2016, 40:471-478.

基金资助

国家重点研发计划资助项目(2021YFB3801304)

AI Summary AI Mindmap
PDF (1869KB)

310

访问

0

被引

导航
相关文章

AI思维导图

/