基于深度学习预测CO2在离子液体中溶解度的研究

罗秉伟 ,  杨玮婧 ,  刘振盈 ,  田敬晓 ,  丁将敏

现代化工 ›› 2026, Vol. 46 ›› Issue (2) : 232 -235.

PDF (1435KB)
现代化工 ›› 2026, Vol. 46 ›› Issue (2) : 232-235. DOI: 10.16606/j.cnki.issn0253-4320.2026.02.036
工业技术

基于深度学习预测CO2在离子液体中溶解度的研究

作者信息 +

Prediction of solubility of CO2 in ionic liquids based on deep learning

Author information +
文章历史 +
PDF (1468K)

摘要

构建了深度神经网络(DNN)和随机森林(RF)技术用于预测CO2在ILs中的溶解度。收集5 000个不同温度和压力下ILs的CO2溶解度值,采用分子描述符(MD)充分获取到ILs的复杂结构信息。以MD作为DNN、RF机器学习模型的输入特征。其中,MD-RF模型以卓越的准确脱颖而出,展示了0.988 4的决定系数(R2)和0.000 5的均方误差(MSE)。

Abstract

Deep neural networks (DNN) and random forest (RF) techniques were used to predict the solubility of CO2 in ILs in this work.5000 CO2 solubility values of ILs at different temperatures and pressures were collected and the complex structural information of ILs using molecular descriptors (MD) were fully obtained.Using MD as the input feature for DNN and RF machine learning models.Among them,the MD-RF model stands out for its excellent accuracy,displaying a coefficient of determination (R2) of 0.988 4 and a mean squared error (MSE) of 0.000 5.

Graphical abstract

关键词

离子液体 / 气体吸收 / 机器学习 / 溶解度 / CO2

Key words

ionic liquids / gas absorption / machine learning / solubility / CO2

Author summay

罗秉伟(1994-),男,硕士,研究方向为聚烯烃新产品开发与应用,

引用本文

引用格式 ▾
罗秉伟,杨玮婧,刘振盈,田敬晓,丁将敏. 基于深度学习预测CO2在离子液体中溶解度的研究[J]. 现代化工, 2026, 46(2): 232-235 DOI:10.16606/j.cnki.issn0253-4320.2026.02.036

登录浏览全文

4963

注册一个新账户 忘记密码

近年来,大气中CO2等温室气体排放量急剧增加,导致了干旱、气候异常、海平面上升等一系列严重问题,给社会各方面的发展带来了严重的负面影响[1]。为减少温室气体排放和缓解全球变暖,世界各地的研究团队正在努力开发新的高效温室气体减排和利用技术[2]。ILs凭借独特的分子结构展现出卓越的性能,在吸收和捕集酸性气体方面显示出较高的效率和选择性,相较于传统有机溶剂,ILs被认为是处理酸性气体问题的潜在解决方案。
ILs是指全部由离子组成在室温或接近室温呈液态的盐。自从ILs在1914年首次报道以来[3],在石油、化工、环境科学等领域引起广泛的关注。1975年,Chum等[4]合成N-烷基吡啶的氯铝酸盐ILs,同时利用FT-IR、Raman等技术手段对ILs的结构和性质进行了深入的研究。该ILs的成功合成意味着ILs在有机、材料等方面进行工业应用有了理论基础。但是由于该ILs性质不够稳定,限制了氯铝酸盐ILs在化工中的应用。使得研究人员未来还需对合成性质稳定的ILs继续努力。随着相关领域的发展,ILs的种类不断扩大,与此同时,科研人员开发了许多新功能的ILs,引起了学术界和工业界的广泛研究。Nordness等[5]探讨了阳离子溶液和阴离子烷基链的长度、结构以及阳离子和阴离子的相互作用基序、温度以及ILs溶液中溶剂强度的影响。证明了阳离子和阴离子的离解程度会影响黏度、密度、表面张力、挥发性以及许多其他重要的化学和物理性质,对ILs未来的继续研究具有重大意义。
目前,ILs在气体吸收方面已经有了广泛的应用。Zhan等[6]使用ILs搭建了一种包括热力学模型、流程模拟、多目标计算在内的含氨尾气分离和氨回收新工艺的系统策略,结果表明ILs的使用大大降低了净化成本和能耗,实现含氨气体的净化。Huang等[7]使用[Bmim][BF4]溶液与LiBF4、NaBF4和KBF4 3种碱金属混合对CO2/CH4进行捕获和分离,金属离子都能与ILs缔合从而实现气体的纯化。Wang等[8]通过分子动力学模拟探究纳米约束ILs杂化膜分离CO2和CH4的潜力,揭示了气体在石墨烯约束下结构、热力学性质和输运之间的定量关系,对高效低成本分离CO2具有重要意义。各研究人员对ILs分离捕捉气体作用规律的揭示为ILs气体分离的工业化应用提供了重要支撑。但是仍存在着很重大的问题:缺乏对ILs微观结构和宏观性质之间关系的研究,无法有效地预测ILs的性质,这使得ILs进一步的开发和应用受到很大的限制。同时,ILs的复杂性导致科研人员和工程师在缺乏广泛的物性数据库的情况下,面临筛选合适ILs的困难。
随着越来越多关于ILs中气体溶解度的研究成果被公开报道,基于大数据驱动的人工智能模型预测气体在ILs中溶解度逐渐受到关注。这种方法主要利用已知的ILs结构和组成信息,通过挖掘和学习大量数据中的经验规律来进行性质的预测,从具有大量特征变量的大型数据集中提取独特见解。Khajeh等[9]提出使用人工神经网络来预测CO2在聚合物中的溶解度,并表明所提出的模型是一种有效的方法。Song等[10]使用基团贡献的方法关联CO2的溶解度与ILs结构、温度和压力之间的关系,开发了ANN和SVM 2种模型,分析了2种模型的预测误差分布。
本工作提出了一种基于MD表征ILs结构的框架,并成功地与DNN和RF 2种不同的智能机器学习算法相结合,用于预测不同ILs中CO2溶解度。通过从文献中收集的5 000个不同温度和压力下ILs的CO2溶解度值,建立了ILs数据库,构建采用RMSE、MSE和R2衡量不同预测模型的效能。

1 基本理论与方法

1.1 数据统计分析

本工作共收集了5 000个CO2在ILs中的溶解度数据点,涵盖了243.2~453.15 K的温度范围,涉及103种ILs,数据来源于Lei等[11]早期的研究成果。图1展示了模型数据集在压力、温度和溶解度方面的分布情况。从图中可以观察到,温度和溶解度数据呈现出均匀分布,而压力数据主要集中在0~50 000 kPa范围内。在这些ILs中,阳离子共有43种,包括吡啶、吡咯烷、咪唑、哌啶和铵等;阴离子则包括硫酸氢根、硝酸根、氯、四氟硼酸根、双(三氟甲基磺酰)胺根等共28种。

1.2 分子描述符

分子描述符(MD)可以用于量化ILs中特定分子结构的相关信息,这些描述符细分为定性和定量2种类型[12]。本工作使用开源化学信息Python软件包的RDKit软件获取阴离子和阳离子的分子描述符(MD),共计168个MD。为了增加MD的丰富性,还添加了温度和压力作为附加描述符,使得MD的总数达到了338个。通过特征工程,成功地减少了数据中的冗余信息。根据特征选择器方法,删除了相关性大于0.98的55个描述符以及151个唯一值描述符。最终,得到了132个对模型贡献较大的描述符。由于原始数据集中不同描述符的值存在较大的量级差异,这可能会影响模型的正确训练。因此,利用scikit-learn模块对输入特征数据进行了归一化处理。

1.3 深度神经网络

深度神经网络(DNN)是一种常用的机器学习模型。在DNN结构中,数据从输入层开始经过一系列隐藏层的处理,最终到达输出层,产生预测结果[13]。DNN的架构通常包含4层,其中包括输入层和输出层,层与层之间是全连接的。输入层负责接收来自分子结构的特征数据,隐藏层则通过激活函数将输入信息转换成隐藏向量,再传递给输出层,最终输出层生成模型的预测结果。在网络训练过程中,反向传播算法用来调整神经元的权重和偏置。随着训练的推进,权重会在每次迭代中进行更新,从而提高模型的准确性,达到更好的数据拟合效果。为了让模型具有更强的表达能力,DNN在隐藏层中引入了激活函数,这一设计大大增强了模型处理复杂数据的能力。

1.4 随机森林

随机森林(RF)是一种基于非参数技术的集成学习模型,是Bagging算法改进和扩展的一种由层次结构规则组成的算法,被广泛应用于解决回归和分类问题[14]。RF的核心思想是构建多个决策树,并将它们整合在一起,以增强模型的稳定性和提高预测的准确性。每个决策树都是在数据集的一个随机子集上训练得到的。这种随机性体现在2个方面:一是通过对原始数据集进行放回抽样来构建训练集;二是在分裂决策树的节点时,从一个随机的特征子集中选择最优特征。这种方法既可以减少模型的过拟合风险,也可以提高模型在未知数据上的泛化能力。RF的核心步骤包括:使用自主抽样法对原始数据进行可放回的随机抽样,形成新的样本集;利用决策树对这些数据进行建模并生成预测结果;最后,通过汇总多个决策树的预测结果来选择最佳的预测值。RF的主要优势在于处理高维数据的能力强,对数据预处理要求低,能够有效地提供关键的特征选择信息。此外,还具有出色的并行性,使得算法可以轻松地在多核处理器上进行并行计算。

2 结果与讨论

2.1 ILs吸收CO2的模型性能讨论

利用R2、MSE和RMSE 3种统计指标对已建立的MD-DNN和MD-RF模型进行预测和评估,发现所提出的机器学习模型均能有效预测CO2在ILs中的溶解度。对不同模型性能的评估表明,这些预测模型方案在训练和测试阶段都能产生卓越的价值,表1显示了2种预测模型的评估性能。
表1中的统计指标数据可以得出结论:MD-DNN和MD-RF 2个模型都能准确预测CO2在ILs中的溶解度,且R2均大于0.9。MD-RF训练集的R2略高于MD-DNN,但测试集的R2却低于MD-DNN,这是因为DNN模型特别擅长处理高度非线性和高维度的数据,能够自动从数据中学习复杂的特征表示,并且DNN模型具有更好的泛化能力和对复杂数据模式的捕捉能力,对学习新数据有更好的适应性,因此,它对未经训练的测试集数据具有更高的预测精度。但从全部数据来看,MD-RF模型的R2更接近于1,均方根误差和均方误差均比MD-DNN小,表明MD-RF模型具有更高的精度。

2.2 误差分析

为了深入探讨并比较不同模型的性能,图2提供了一种直观的方式,通过展示实验值与预测值之间的误差分布,来评估各模型的精度。通过误差直方图分析,可以观察到2个模型中大多数误差都聚集在-0.1~0.1之间的区域,只有一小部分误差的绝对值超过了0.1。与MD-DNN模型相比,MD-RF模型显示出更窄的误差范围,这与之前的分析结果是一致的,进一步证明了其优越的预测能力,具有更高的预测精度。综合考虑所有因素,MD-RF模型的整体预测性能最为出色,能够准确地预测CO2在ILs中的溶解度,展现了在处理复杂非线性关系和高度特定领域问题时的强大能力。

3 结论

提出了一种基于MD量化ILs结构与DNN、RF 2种不同机器学习算法相结合的用于预测CO2在不同ILs中溶解度的方法。通过文献收集CO2在离子液体中不同条件下的溶解度,建立了离子液体MD结构信息数据库。将分子的MD输入DNN、RF机器学习模型,预测了CO2在离子液体中的溶解度。并利用R2、MSE和RMSE 3种统计指标对模型进行评估,且2个模型的误差都聚集在-0.1~0.1之间。但MD-RF模型的整体预测性能具有更高的精度,展现了在处理复杂非线性关系和高度特定领域问题时的强大能力,能够准确地预测CO2在ILs中的溶解度。

参考文献

[1]

Heinrich L, Koschinsky A, Markus T, et al. Quantifying the fuel consumption,greenhouse gas emissions and air pollution of a potential commercial manganese nodule mining operation[J]. Marine Policy, 2020, 114:103678.

[2]

Dunn C A, Shi Z, Zhou R, et al. (cross-linked poly(ionic liquid)-ionic liquid-zeolite) Mixed-Matrix membranes for CO2/CH4 gas separations based on curable ionic liquid prepolymers[J]. Industrial & Engineering Chemistry Research, 2019, 58(11):4704-4708.

[3]

Plechkova N V, Seddon K R. Applications of ionic liquids in the chemical industry[J]. Chem Soc Rev, 2008, 37(1):123-150.

[4]

Chum H L, Koch V R, Miller L L, et al. Electrochemical scrutiny of organometallic iron complexes and hexamethylbenzene in a room temperature molten salt[J]. Journal of the American Chemical Society, 1975, 97:3264-3265.

[5]

Nordness O, Brennecke J F. Ion Dissociation in ionic liquids and ionic liquid solutions[J]. Chemical Reviews, 2020, 120(23):12873-12902.

[6]

Zhan G, Cao F, Bai L, et al. Process Simulation and Optimization of ammonia-containing gas separation and ammonia recovery with ionic liquids[J]. ACS Sustainable Chemistry & Engineering, 2020, 9(1):325312.

[7]

Huang X. Experimental and simulation study on the capture and separation of CO2/CH4 by alkali metal complex ionic liquid[J]. Fuel, 2022, 329:125444.

[8]

Wang C, Wang Y, Liu J, et al. Entropy driving highly selective CO2 separation in nanoconfined ionic liquids[J]. Chemical Engineering Journal, 2022, 440:135918.

[9]

Khajeh A, Modarress H, Rezaee B. Application of adaptive neuro-fuzzy inference system for solubility prediction of carbon dioxide in polymers[J]. Expert Systems with Applications, 2009, 36(3):5728-5732.

[10]

Song Z, Shi H, Zhang X, et al. Prediction of CO2 solubility in ionic liquids using machine learning methods[J]. Chemical Engineering Science, 2020, 223:115752.

[11]

Lei Z, Dai C, Chen B. Gas Solubility in ionic liquids[J]. Chemical Reviews, 2014, 114(2):1289-1326.

[12]

张钰, 魏世丞, 董超芳, . 定量结构-性质关系(QSPR)中的计算方法研究进展[J]. 科学通报, 2021, 66(22):2832-2844.

[13]

Stelzer F, Röhm A, Vicente R, et al. Deep neural networks using a single neuron:Folded-in-time architecture using feedback-modulated delay loops[J]. Nature Communications, 2021, 12:5164.

[14]

张锟滨, 陈玉明, 吴克寿, . 粒向量驱动的随机森林分类算法研究[J]. 计算机工程与应用, 2024, 60(3):148-156.

基金资助

2019年宁夏青年拔尖人才培养工程(宁人社发〔2019〕90号)

2024年宁夏回族自治区重点研发计划项目(2024BEE02038)

2023年国家能源集团科技创新项目(GJNY-23-53)

AI Summary AI Mindmap
PDF (1435KB)

274

访问

0

被引

导航
相关文章

AI思维导图

/