原油中石蜡、胶质和沥青质3种组分的含量即原油组分在很大程度上会影响油田开采及输送过程[1-2],其组成信息是油田勘探开发的基础数据和设计依据,对油田开展各项基础工作有重要的指导意义。因此,对原油组分含量进行检测是油田现场工作必不可少的一环。目前,现场对原油组分的检测按照SY/T 0755-2012《原油中蜡、胶质、沥青含量的测定法》进行。该方法采用溶剂相似相溶、色谱原理,利用不同溶剂的极性、吸附、脱附能力差异分离原油中的组分,从而得到其含量,但检测周期较长,检测精度低,并且需接触有毒有害溶剂,因此,其检测效率一直不高。
混合物红外光谱中特征吸收峰的强度能够反映出对应成分的含量,依据该原理可利用红外光谱对原油成分进行分析,这种方法检测快、操作安全、不破坏样品。在定量原理上,由于油品组成复杂,利用单个谱峰强度难以实现准确定量分析,需借助多元分辨、多元校正建立预测模型,再通过模式识别对数据规律进行解析[3-6]。该方法已应用在油品物化性质的快速检测中,例如渣油四组分的检测、原油密度及酸值检测[7-9]。
利用化学计量学原理,基于300组渤海地区的原油样品(其中240组原油样品用于模型建立,60组原油样品用于模型验证),使用ATR-ZnSe晶体附件对原油样品进行红外光谱采集,利用相关系数及校正标准偏差确定建模波段及最佳主因子数[10],建立中红外光谱与原油组分的多元校正模型[11-12],利用原油样品的红外光谱,预测原油组分,旨在为原油组成检测提供一种更为高效、准确的检测分析手段,为油田勘探、开发提供及时准确的检测数据。
采用渤海地区的原油作为样品,以轻质原油(密度<0.87 g/cm3)80组、中质原油(密度≥0.87~0.92 g/cm3)70组、重质原油(密度≥0.92~1.00 g/cm3)90组,共240组进行模型建立,以60组原油样品进行模型验证。
红外光谱法可借助对比吸收峰的强度来定量分析混合物的组成[13-15],只要混合物中各组分存在1个不受其他组分干扰的特征吸收峰,即可实现其组成测定。事实上,气体、液体和固体样品都可应用红外光谱法作定量分析,因此本研究采用红外光谱检测300组原油样品的组分。
参照GB/T 32198-2015《红外光谱定量分析技术通则》,本方法使用Thermo 5700傅里叶红外光谱仪、ATR-ZnSe晶体附件及DTGS检测器对原油样品进行红外光谱采集,采集范围为400~4000 cm-1,每个样品扫描64次。为保证红外谱图采集的稳定性及准确性,检测房间温度控制在20~25 ℃、湿度为30%~40%。首先采集空气背景,扣除H2O、CO2的干扰;再将均一原油样品涂抹至ATR-ZnSe晶体附件样品池中,采集原油样品红外光谱图;最后用石油醚、无水乙醇清洁样品池,直至通过背景测试,进行下一样品的检测。
化学计量学主要通过统计方法,建立化学体系的实测值与其状态之间的内在联系,而多元校正是化学计量学的主要处理方法之一,能建立物质浓度或其他物理量与分析仪器响应之间的关联,基于化学计量的原油组分检测流程如图 1所示。
中红外光谱可提供以样品组成和物性为基团信息的特征吸收峰,其峰高和吸光度成正比关系,且光谱灵敏度高、信息量大,适用于原油组分的定量分析。而原油样品在400~4000 cm-1波长范围内的强烈吸收峰与原油组分信息密切相关,但又不能形成一一对应关系[16]。采用多元校正方法能够从未知混合物的分析数据中提取纯物质的各种响应曲线,无需预先知道未知样本的种类及组成信息,可解决传统分析化学不能解决的问题,如复杂多组分动力学平衡体系的解析、色谱及其联用方法中复杂体系的峰纯度检测、重叠谱峰的分辨等[17]。
利用相关系数及校正标准偏差确定建模波段及最佳主因子数,建立中红外光谱与原油组分的多元校正模型,预测样品组分,进行重复性、再现性分析,与现有标准方法的预测数据进行比较。
对300组原油样品进行红外光谱采集(见图 2),从光谱图中可以看出每个样品均存在3段强吸收区,分别位于2800~3100 cm-1、1200~1600 cm-1和650~900 cm-1处。2800~3100 cm-1反映原油中烷烃、芳烃的甲基、亚甲基、羰基、酰胺等基团信息;1200~1700 cm-1反映原油中烷烃、烯烃、环烷烃、芳烃中羟基、氨基、羰基等基团信息;650~900 cm-1为指纹峰区,不仅反映原油中芳烃、烯烃中氨基、羟基等基团信息,还体现无机化合物如碳酸根、硫酸根、硝酸根、硅酸盐等基团信息。
建模波段是预测结果准确性的主要影响因素,本研究建立了240个原油样品的二阶微分红外光谱与组分相关系数(R)图,如图 3所示。由此可以看出,随波长变化,组分的相关系数波动较大,基本分布在-0.8~0.8之间。石蜡、胶质和沥青质分别在700~3500 cm-1、650~3500 cm-1、700~3500 cm-1波段内相关系数较高,相关性较强。
由于组分的相关系数在各自波段内波动较大,无法确定出建模的最佳波长,因此将波段分别细分为3段式、2段式及1段式进行对比分析,确定最佳建模波段,各模型不同建模波段的相关系数及校正标准偏差见表 1。
由表 1可知,3种组分的建模波段都是2段式最优,相关系数和校正标准偏差同时达到最优,1段式的全光谱模型效果最差。建模的最佳波段集中在650~1700 cm-1、2400~3500 cm-1两个范围,这是由于原油是多种液态烃的混合物。这两个强吸收区域是原油中各种烃类分子(烷烃、环烷烃和芳烃等)上甲基(-CH3)和亚甲基(-CH2)的对称和反对称伸缩、振动的特征吸收峰。1380 cm-1和1460 cm-1附近的中等强度吸收峰分别是由-CH3和-CH2的弯曲振动产生的,1600 cm-1附近相对较弱的吸收峰是由芳环C=C伸缩振动产生的;芳烃C-H面内弯曲振动吸收峰则位于1000~1300 cm-1范围内,面外弯曲振动位于700~900 cm-1范围内[18]。
原油中蜡的主要成分为饱和烃,包括正构、异构烷烃和少量环烷烃,建模波段主要集中在烃类特征吸收峰700~1700 cm-1、2400~3100 cm-1波数范围。沥青质、胶质的建模波段在指纹区比例更大,这是由于胶质与沥青质结构更为复杂,以多个芳环组成的稠合芳香环系为核心,周围连接有若干个环烷环,芳香环和环烷环上都有若干个长度不一的正构或异构侧链和杂环[19],支链中大多杂有硫、氮、氧,并且含有少量无机盐类黏土和微量金属元素,这些分子基团在650~1700 cm-1、2400~3500 cm-1波段区域有相应的特征吸收峰。
主因子分析法是利用降维的思想,把多指标变量转化为少量综合指标的多元统计分析方法,而这些综合指标可反映原来多变量的主要信息,主因子数不同,模型模拟结果会出现较大的误差。在选定建模波长范围后,建立校正模型,考察主因子数,得到不同主因子数下各模型的相关系数和校正标准偏差(见表 2),采用偏最小二乘方法确定最佳主因子数。
表 2表明,在胶质和蜡两个校正模型中,主因子数不同时R相差不大,而校正标准偏差在主因子数为10时均比较小;在沥青质模型中,当主因子小于10时,R较低,校正标准偏差较高,主因子大于10时,出现过拟合情况,R值变化不大,校正标准偏差增高。由预测残差平方和(PRESS)随主因子数的变化曲线可以看出,随着主因子数的增加(见图 4),残差平方和迅速降低,当主因子数为6时下降幅度明显降低,主因子数为10时曲线趋于平缓,不再下降,因此最终确定模型最佳主因子数为10。
采用主因子数为10建立校正模型,预测25个原油样品的组分数据,对比分析本模型预测值(方法1)、标准方法预测值(方法2)与实际值,结果如图 5所示。由图 5可见,两种方法对于沥青质和蜡的含量预测结果都非常接近实际值,对胶质含量预测均存在一定误差,而采用本方法建立的校正模型预测组分,其结果与传统标准方法的预测值差别较小。
将校正模型的预测值与实际值比较,处理后得到使用校正模型预测的组分再现性与重复性数值并绘制成箱形图(见图 6)。由此可见,25个样品的再现性均小于15%,优于标准方法对再现性的要求。其中沥青质和胶质的再现性优于蜡,这是由于标准检测蜡的精度较低,同时蜡的结构反映在中红外光谱中的特征峰不如沥青质、胶质强度高而造成的。由于红外检测重复性好[20],因此使用本方法对3种物质进行预测,重复性均低于5%,优于标准方法对重复性的要求。
此外,根据式(1)计算得到校正模型预测结果的平均相对误差、平均绝对相对误差和标准差依次为5.3%、5.1%、6.1%,而标准方法预测结果的3个误差分别为7.8%、5.1%、6.0%。由此可以看出,基于化学计量学原理,建立中红外光谱与原油组分的多元校正模型预测结果准确,误差低于标准方法,精度较高。
式中:Xpre为使用方法1(或方法2)得到的预测值;Xact为实际值;X为使用方法1(或方法2)预测值的平均数;Ei为第i组数据的相对误差;Er为平均相对误差;Ea为平均绝对相对误差;S为标准差。
(1) 针对原油组分的传统标准检测方法一般存在检测周期长、精度与效率低及溶剂有毒等问题,提出了通过检测原油红外光谱来预测其组分的方法,实验证实了该方法的可靠性与快捷高效。
(2) 基于化学计量学原理,建立红外光谱与原油中沥青质、胶质及石蜡含量的多元校正模型,能够通过检测原油红外光谱较准确地测定原油组分, 但使用此方法需配有原油样品的红外数据库,并且可随样品的增加而扩展。。
(3) 原油组分建模的最佳波段集中在650~1800 cm-1与2400~3100 cm-1两个范围,其光谱最佳主因子数为10,在多次重复性实验中该方法重复性小于3%、再现性小于15%,优于标准检测方法。