基于机器学习的有机胺吸收CO2性能预测

艾孜买提江·艾尔肯 ,  代琴 ,  王亚囡 ,  张天琦 ,  焦燕麟 ,  张稚杰 ,  汪黎东 ,  于广飞

现代化工 ›› 2025, Vol. 45 ›› Issue (S2) : 439 -443.

PDF (2566KB)
现代化工 ›› 2025, Vol. 45 ›› Issue (S2) : 439-443. DOI: 10.16606/j.cnki.issn0253-4320.2025.S2.075
工业技术

基于机器学习的有机胺吸收CO2性能预测

作者信息 +

Machine learning based prediction on performance of organic amine in absorbing CO2

Author information +
文章历史 +
PDF (2627K)

摘要

针对传统开发方式周期长、成本高、效率低的问题,从22种有机胺CO2吸收体系参数中筛选并采用了10种关键特征变量,通过7种不同的机器学习方法构建了常见有机胺溶剂吸收CO2性能的预测模型。研究结果表明,GBDT模型具有最佳的预测表现。基于SHAP、PI及MDI方法的特征重要性分析结果显示,二氧化碳分压、温度、胺基百分比是影响CO2吸收效果的关键特征,并以此揭示了其优势区间。

Abstract

In order to solve the long cycle,high cost and low efficiency problems of traditional development methods,10 key characteristic variables are selected from 22 kinds of parameters in organic amine-route CO2 absorption system,and a prediction model for CO2 absorption performance of common organic amine solvent is constructed through 7 kinds of machine learning methods.It is found that GBDT model presents the best prediction performance.The characteristic importance analysis results based on SHAP,PI and MDI methods show that the partial pressure of carbon dioxide,temperature,and amino group percentage are the key characteristics that affect the CO2 absorption effect,and thus their advantage ranges are revealed.

Graphical abstract

关键词

CO2捕集 / 液相吸收法 / 有机胺 / 预测模型 / 机器学习

Key words

CO2 capture / liquid phase absorption method / organic amine / prediction model / machine learning

Author summay

艾孜买提江·艾尔肯(1998-),男,硕士生

引用本文

引用格式 ▾
艾孜买提江·艾尔肯,代琴,王亚囡,张天琦,焦燕麟,张稚杰,汪黎东,于广飞. 基于机器学习的有机胺吸收CO2性能预测[J]. 现代化工, 2025, 45(S2): 439-443 DOI:10.16606/j.cnki.issn0253-4320.2025.S2.075

登录浏览全文

4963

注册一个新账户 忘记密码

随着全球经济的快速发展,人类对能源的需求急剧增加,特别是以石油、煤炭、天然气为主的化石能源。然而,化石能源的燃烧导致了大量温室气体的产生。二氧化碳(CO2)作为主要温室气体加剧了全球的气候变化,造成海平面上升、极地冰川融化等问题。为有效减少碳排放,CO2的捕集、利用和封存技术(CCUS)的实施与发展至关重要[1]。其中,CO2捕集是CCUS技术中的重要部分,而使用有机胺溶剂的化学吸收法则是目前工业应用上最成熟的CO2捕集技术之一[2]
高性能有机胺CO2吸收体系的开发是化学吸收法的关键,例如单乙醇胺(MEA)、甲基二乙醇胺(MDEA)和哌嗪(PZ)等有机胺溶剂都已被用于开发高性能有机胺CO2吸收体系[3-4]。然而,通过实验试错法设计和建立高性能有机胺CO2吸收体系仍然存在周期长、成本高、效率低的问题。近年来,随着机器学习技术的迅速发展,已有许多研究通过构建吸收溶剂物理化学性质与其吸收能力间的构效关系模型,实现高效吸收体系的性能预测与开发[3]。这也为高性能有机胺CO2吸收体系的筛选与发展提供了新的思路。
考虑到目前在基于有机胺溶剂的CO2吸收研究中,机器学习的应用在算法类型、描述符选择范围及重要特征分析方法等方面仍较为局限,采用了7种代表性机器学习算法和10种特征描述符,构建有机胺溶剂吸收CO2的预测模型。在此基础上,结合多种特征重要性分析方法与三维空间散点图、二维散点平面映射等手段,进一步揭示影响CO2吸收效果的关键因素并以此提出优势区间。该研究可为有机胺CO2吸收体系的设计与开发提供理论支撑与方法支持,助力我国碳中和、碳达峰战略目标的实现。

1 研究方法与原理

1.1 机器学习算法

机器学习算法的选择是影响模型预测效果的关键。本研究选择树模型、神经网络及经典回归模型3类(共7种)具有代表性的机器学习算法进行建模并系统对比性能差异,图1展示了具体研究流程。
树模型作为一类机器学习领域中的经典算法,算法逻辑决定其在中小型数据集和模型可解释性上具有天然优势。选取了3种主流树模型进行对比:随机森林(RF)、极限梯度提升(XGBoost)和梯度提升决策树(GBDT)。值得注意的是,GBDT方法可通过梯度提升集成决策树,具有高预测精度、强大的非线性关系建模能力。这些优点使得GBDT在环境行业污染物预测相关研究中被普遍应用[5-6]
神经网络(NN)是一种模仿生物神经网络的结构和功能的计算模型。在本研究中,选用多层感知机(MLP)和长短期记忆网络(LSTM)2类NN模型。其中,MLP作为基础的神经网络模型,是在过往研究中最广泛使用的模型之一[7]。而LSTM则是一类较为高阶的神经网络模型,尽管参数规模较大、训练成本较高,但凭借对复杂大量数据的建模能力,常能在数据中实现更高的预测精度。
岭回归(RR)和支持向量回归(SVR)是2类简单、高效的典型回归方法,由于建模快、参数少,无需复杂调优,使得这2类经典算法在环境领域被使用[8-9]

1.2 特征重要性分析方法

考虑到机器学习模型通常被认为是黑盒模型,因此需要特征重要性分析为模型提供可解释性,揭示各个输入特征在有机胺CO2吸收体系中的重要性程度。本研究使用MDI(平均不纯度减少)、PI(排列重要性)和SHAP(Shapley加法解释)方法分别对机器学习模型进行特征重要性分析,通过不同的分析视角研究每个特征对整体模型预测的重要性。
其中,MDI方法通过每个特征在决策树节点分裂时带来的不纯度减少计算每个特征在所有决策树中的MDI值。MDI值越大,说明该特征对模型预测结果的影响越大;PI方法通过随机打乱某特征值,观察模型预测准确性变化,量化其对模型决策的关键影响;SHAP则是一种基于博弈论的分析方法,可通过计算每个特征对模型预测的贡献,从而允许对黑盒模型进行全局和局部解释。

1.3 模型评价标准

决定系数(R2)、均方根误差(RMSE)和平均绝对误差(MAE)用于评估机器学习模型的预测准确性。R2RMSEMAE值的计算公式如式(1)~(3)。其中R2取值范围为[0,1],值越接近1说明拟合程度越高,RMSEMAE的值则与预测变量值相关,越低的RMSEMAE代表了越小的模型误差。
R 2 = 1 - [ n = 1 N ( y ^ - y ) 2 ] / [ n = 1 N ( y ^ - y - ) 2 ]
R M S E = [ n = 1 N ( y ^ - y ) 2 ] / N
M A E = ( 1 / N ) n = 1 N | y ^ - y |
式中, y ^y y -分别是目标特征的预测值、真实值和平均值;N是数据点的总数。

2 结果与讨论

2.1 数据搜集与预处理

首先,使用多种主题关键词(包括CO2吸收、CO2捕集、有机胺吸收剂等)和主流数据库(例如Web of Science和Google Scholar)对使用有机胺溶剂吸收CO2的相关研究进行了全面的文献搜集与整理。从中收集到共500个数据点构成原始数据集[4,10-12],包括9种常见有机胺溶剂类型:单乙醇胺(MEA)、甲基二乙醇胺(MDEA)、氨基乙基丙二醇(AEPD)、二乙醇胺(DEA)、2-氨基-2-甲基-1-丙醇(AMP)、三乙醇胺(TEA)、2-氨基-2-羟甲基-1,3-丙二醇(AHPD)、2-氨基-2-甲基-1,3-丙二醇(AMPD)、哌嗪(PZ)。
随后,对已收集数据集中的各特征进行了皮尔逊相关性分析,将皮尔逊相关系数(PCC)大于0.8的输入特征剔除,以避免高相关性变量为模型带入噪声从而影响模型预测能力。此外,特征数量的减少还可以有效降低模型复杂性,提升泛化能力。最终输入特征的数目由22个精简为10个,可分为反应条件与有机胺溶剂性质2类(表1)。精简与挑选后的模型输入特征和目标变量的皮尔逊相关性如图2所示。从图中可以发现,在输入特征和目标变量之间(PCC值在-0.42~0.44)及各输入特征变量之间(PCC值大多在-0.7~0.7)没有观察到显著的相关性。

2.2 模型构建和性能评估

经过数据预处理后,80%的数据集被划分为训练集,其余20%被划分为测试集。建模途中使用网格搜索调参优化提升模型效果并使用五折交叉验证提升模型泛化能力。如表2所示,3类模型的效果对比显示树模型整体表现优于神经网络模型与经典回归模型。具体来说,在树模型中,GBDT展现出了最低的MAE测试集(0.08)、RMSE测试集(0.08)以及最高的$R_{\text {测试集 }}^{2}$(0.915)。同时,GBDT模型中的$R_{\text {训练集 }}^{2}$(0.959)、$R_{\text {测试集 }}^{2}$(0.915)、与$R_{\text {交叉验证 }}^{2}$(0.879)的数值也较为一致,体现了GBDT模型出色的普适性和泛化能力。对于2种神经网络模型,MLP的 RMSE测试集为0.14,而$R_{\text {测试集 }}^{2}$仅为0.79,LSTM的 RMSE测试集和$R_{\text {测试集 }}^{2}$则为0.13与0.78。2种模型的$R_{\text {测试集 }}^{2}$均低于GBDT,且RMSE测试集偏高。此外,2类经典的回归模型,SVR和RR的模型效果同样有限,测试集R2仅有0.78和0.64,与树模型效果具有较大差距。
基于上述结果,可以发现GBDT模型总体上具有最优秀的预测能力和出色的泛化能力。因此,选择GBDT模型作为最佳效果模型进行后续的研究分析。

2.3 特征重要性分析

采用SHAP、PI与MDI 3种方法,基于上述最优GBDT模型分别进行特征重要性分析,通过不同的分析视角研究每个特征对整体模型预测的影响程度,揭示特征在有机胺CO2吸收体系中的重要性程度。如表3所示,分析结果显示3种方法获得的特征重要性排序结果高度一致。前7种最重要的输入特征均依次为二氧化碳分压、温度、胺基百分比、Log P、胺浓度、pKa和q(N)。这种一致性说明了模型重要性排序结果的可靠性。值得注意的是,这些结果也与过往有机胺溶剂吸收CO2实验研究中的结果一致[13-14]。例如对前3个最重要的特征而言,发现二氧化碳分压通过改变分子扩散速度,可以显著影响CO2吸收效果,是气体溶解的核心驱动力,因此被认为是有机胺溶剂吸收CO2最重要的影响因子[14-16]。其次,由于温度可同时影响CO2吸收反应的反应动力学与热力学2方面,从而影响CO2吸收效率,因此在过往研究中也被认为是有机胺CO2吸收体系中的重要影响因素之一[16]。胺基百分比的重要性则可归因于其综合体现了胺基的数量和有机胺浓度,可通过碱性位点数量和传质阻力2方面影响CO2吸收效果[17]

2.4 CO2吸收优势区间的确立与定量构效关系

前述特征重要性方法的分析结果与过往实验结果均表明,二氧化碳分压、温度和胺基百分比是影响CO2吸收效果的最关键的3种特征。在此基础上,进一步绘制这些特征与CO2吸收效果的三维空间散点图和二维散点平面映射图,以揭示CO2吸收效果的优势区间。
结果如图3所示,点的大小代表了CO2吸收量的大小。根据三维空间散点图,较大的点普遍出现在中低温区与中低胺基百分比的区间内。随后通过二维散点平面映射图,分别观察二氧化碳分压与温度、二氧化碳分压与胺基百分比和温度与胺基百分比对CO2吸收效果的影响情况。从图中可以发现,对CO2吸收有利的优势区间集中在T=300~350 K、胺基百分比=0~40的区域中。相对而言,压强则未表现出显著的优势范围。这些结果也可以得到过往实验研究的支持。例如Balsora等[18]提出二氧化碳溶解度可在一定范围内随温度升高而降低,并且在313.14 K时达到了0.869 mol/mol的最大二氧化碳吸收量。同时,相对较低的胺浓度可以避免分子黏度提升带来的传质阻力,从而有利于CO2的吸收。此外,使用较低的温度、分压、胺浓度的反应条件也有助于降低技术应用成本。
最后,还通过多元线性回归方法进一步建立了前述重要特征与CO2吸收效果间的定量构效关系。如式(4)所示,虽然其拟合度相比机器学习模型仍较为有限,但方程中系数的正负性也可以在一定程度上说明各重要特征对CO2吸收性能的影响。具体而言,方程中温度和胺基百分比的系数是负数,这表明当2种因素处于相对较小区间时可能会对CO2的吸收更有利,这也与前述优势区间的分析结果相一致。
$\begin{array}{c}\alpha \mathrm{CO}_{2}=2.022+0.01 P-0.004 T-0.006 \times \text { 胺基百分比 } \\R^{2}=0.542\end{array}$

3 总结与展望

本研究针对传统有机胺CO2吸收体系开发周期长、成本高、效率低等问题,通过机器学习建模,实现了高性能有机胺CO2吸收体系的性能预测。研究表明,GBDT模型展现出最优预测精度和出色的泛化能力。多种特征重要性分析方法共同揭示了二氧化碳分压、温度和胺基百分比为影响CO2吸收效果的核心因素。基于二维散点平面映射图进一步阐明了中低温度与较低胺基百分比的CO2吸收优势区间。本工作可为高性能有机胺CO2吸收体系的设计与开发提供新的思路,该研究策略也可延伸应用于环境治理等相关领域的未来研究。

参考文献

[1]

赵志强, 张贺, 焦畅, . 全球CCUS技术和应用现状分析[J]. 现代化工, 2021, 41(4):5-10.

[2]

盛依依. 二氧化碳捕集技术研究及工业化进展[J]. 现代化工, 2025, 45(3):1-6.

[3]

Shen Y, Gong Y, Sun L, et al. Machine learning-driven assessment of relationship between activator properties in phase change solvent and its absorption performance for CO2 capture[J]. Separation and Purification Technology, 2023, 309:123092.

[4]

Qian J, Sun R, Sun S, et al. Computer-free group-addition method for pka prediction of 73 amines for CO2 capture[J]. Journal of Chemical & Engineering Data, 2017, 62(1):111-122.

[5]

Namdeo S, Srivastava V C, Mohanty P. Machine learning implemented exploration of the adsorption mechanism of carbon dioxide onto porous carbons[J]. Journal of Colloid and Interface Science, 2023, 647:174-187.

[6]

Yang A, Sun S, Su Y, et al. Insight to the prediction of CO2 solubility in ionic liquids based on the interpretable machine learning model[J]. Chemical Engineering Science, 2024, 297:120266.

[7]

侯克鹏, 包广拓, 孙华芬. SSA-MLP模型在岩质边坡稳定性预测中的应用[J]. 安全与环境学报, 2024, 24(5):1795-1803.

[8]

Wen L, Shao H. Analysis of influencing factors of the carbon dioxide emissions in China’s commercial department based on the STIRPAT model and ridge regression[J]. Environmental Science and Pollution Research, 2019, 26:27138-27147.

[9]

唐菲菲, 胡佳赢, 马英, . 基于递归特征消除选择的粒子群优化-支持向量机回归模型的滑坡位移预测方法[J]. 工业建筑, 2024, 54(11):50-60.

[10]

Fujii T, Sako M, Ishihama K, et al. Prediction of CO2 absorbing performance of amine aqueous solution using random forest models[J]. Gas Science and Engineering, 2024, 129:205417.

[11]

Yang X, Rees R J, Conway W, et al. Computational modeling and simulation of CO2 capture by aqueous amines[J]. Chemical Reviews, 2017, 117(14):9524-9593.

[12]

Li H, Yan D, Zhang Z, et al. Prediction of CO2 absorption by physical solvents using a chemoinformatics-based machine learning model[J]. Environmental Chemistry Letters, 2019, 17(3):1397-1404.

[13]

Khan A A, Halder G N, Saha A K. Experimental investigation on efficient carbon dioxide capture using piperazine (PZ) activated aqueous methyldiethanolamine (MDEA) solution in a packed column[J]. International Journal of Greenhouse Gas Control, 2017, 64:163-173.

[14]

Kumar S, Mondal M K. Equilibrium solubility of CO2 in aqueous blend of 2-(Diethylamine)ethanol and 2-(2-Aminoethylamine)ethanol[J]. Journal of Chemical & Engineering Data, 2018, 63(5):1163-1169.

[15]

Ali M, Hamdi Z, Elochukwu H, et al. Investigation on CO2 solubility for safer CO2 storage:Experimental study on the effect of pH;proceedings of the offshore technology conference brasil[C]. 2023,D031S037R006.

[16]

Aghel B, Janati S, Wongwises S, et al. Review on CO2 capture by blended amine solutions[J]. International Journal of Greenhouse Gas Control, 2022, 119:103715.

[17]

Puxty G, Rowland R, Allport A, et al. Carbon dioxide postcombustion capture:A novel screening study of the carbon dioxide absorption performance of 76 amines[J]. Environmental Science & Technology, 2009, 43(16):6427-6433.

[18]

Balsora H K, Mondal M K. Solubility of CO2 in an aqueous blend of diethanolamine and trisodium phosphate[J]. Journal of Chemical & Engineering Data, 2011, 56(12):4691-4695.

基金资助

北京市自然科学基金青年基金项目(8254059)

国家自然科学基金青年科学基金项目(52200126)

国家自然科学基金国家杰出青年科学基金项目(52325004)

AI Summary AI Mindmap
PDF (2566KB)

231

访问

0

被引

导航
相关文章

AI思维导图

/