一种基于L2连续投影算法的LIBS波长筛选方法与流程

    专利2025-05-19  25


    本发明涉及光谱分析,尤其涉及一种基于l2连续投影算法的libs波长筛选方法。


    背景技术:

    1、目前对物质成分进行分析的常用方法一般有化学分析法和xrf荧光分析法。化学分析法分析精度高,但是该方法操作复杂且分析周期长,分析效率低,无法做到实时在线检测。xrf荧光分析法能够实现在线检测,但是在线检测无法检测原子序数20之前的元素,且x射线具有放射性,具有潜在的危害性。而激光诱导击穿光谱(laser-induced breakdownspectroscopy,简称libs)技术作为一种新兴检测方法,因其可分析元素范围广、对待测物质的形态和样品制备要求低、可实时在线检测、多元素同时分析等优点受到越来越多研究人员的重视。

    2、在利用激光诱导击穿光谱技术进行定量分析时,由于光谱数据包含大量噪声干扰,同时受自吸收及基体效应的影响,导致变量之间存在多重共线性的问题。随着光谱仪分辨率的不断提高,数据维度越来越高,其中包括大量对成分分析无用的冗余信息,增加了建模的复杂度,如果将全谱数据进行建模容易造成过拟合。

    3、光谱领域常用的波长筛选方法有无信息变量消除、连续投影算法等。传统连续投影算法中计算交叉验证均方根误差的基模型为多元线性回归,然而由于libs光谱噪声大、背景信息强的特点,所选的投影最大的向量仍可能是无关变量或噪声变量,在循环计算最优变量子集时使用多元线性回归建模同样面临着过拟合风险,因此我们提出了l2连续投影算法,通过在多元线性回归上增加l2正则项约束的方法使得模型参数的权重尽量保持较小,进一步降低数据间多重共线性,提高所选变量的可靠性。


    技术实现思路

    1、针对现有技术的不足,本发明提供一种基于l2连续投影算法的libs波长筛选方法,对传统连续投影算法进行改进,对计算均方根误差阶段所使用的多元线性回归上增加了l2正则项约束(l2),对各个变量子集进行评估。交叉验证均方根误差最小的特征波段即为本发明算法的特征结果,解决传统连续投影算法筛选出的波长向量仍可能产生过拟合现象的问题。

    2、一种基于l2连续投影算法的libs波长筛选方法,包括以下步骤:

    3、步骤1:采集待测物质的激光诱导击穿光谱的原始全谱数据,进行最小最大值归一化和去趋势矫正处理,得到多维谱线数据集,将多维谱线数据集划分为训练集、验证集和测试集。

    4、步骤2:设定参数:设定迭代次数变量 h,最大迭代次数为 h;训练集样本数为,波长变量数为,建立光谱矩阵。

    5、步骤3:在光谱矩阵中任选第列光谱数据,记为。

    6、设定为光谱矩阵中除去已选择列向量外的所有列向量:

    7、;其中为所选变量的起始位置,,为选择的最后一个波长变量位置。

    8、步骤4:使用对中所有列向量进行投影:

    9、,。

    10、上式中,为正交投影算子,为所选列向量,为矩阵的转置,得到最大投影值对应的列向量索引,那么,。

    11、步骤5:令,。

    12、步骤6:判断 h是否小于;

    13、当时,执行步骤3;

    14、当时,得到提取出的变量集合。

    15、步骤7:将提取出的变量集合分别建立带l2正则化约束的多元线性回归模型,得到交互验证均方根误差,对应不同的候选子集,其中最小值对应的子集即为最优变量子集。

    16、所述带l2正则化约束的多元线性回归模型是指在多元线性回归模型的基础上增加了l2正则化项;其中,所述多元线性回归模型为:

    17、。

    18、上式中,为权重,为矩阵的转置,为自变量,为偏差;

    19、其代价函数为:

    20、。

    21、上式中,为样本个数,是第个样本,是第个样本对应的铁元素浓度实际值。

    22、带l2正则化项的多元线性回归模型的代价函数为:

    23、。

    24、其中为非负数,表示l2范数,为权重,为l2正则化项。

    25、一种基于l2连续投影算法的libs波长筛选系统,用于实现前述一种基于l2连续投影算法的libs波长筛选方法,包括光谱采集设备模块、数据预处理模块、划分数据集模块、l2连续投影算法筛选特征模块;

    26、所述光谱采集设备模块,用于采集待测物质的激光诱导击穿光谱的原始全谱数据;

    27、所述数据预处理模块,用于对采集待测物质的激光诱导击穿光谱的原始全谱数据,进行最小最大值归一化和去趋势矫正处理,得到多维谱线数据集;

    28、所述划分数据集模块,用于将多维谱线数据集划分为训练集、校验集和测试集并存储在存储器中;

    29、所述l2连续投影算法筛选特征模块,用于提取光谱数据的最优变量子集。

    30、采用上述技术方案所产生的有益效果在于:

    31、本发明提供一种基于l2连续投影算法的libs波长筛选方法,对传统连续投影算法进行了改进,通过l2连续投影算法结合支持向量回归模型以进行基于libs的成分定量分析,进一步降低了数据的多重共线性问题,提高了定量分析的精度。



    技术特征:

    1.一种基于l2连续投影算法的libs波长筛选方法,其特征在于,包括以下步骤:

    2.根据权利要求1所述的一种基于l2连续投影算法的libs波长筛选方法,其特征在于,所述步骤3具体为:设定为光谱矩阵中除去已选择列向量外的所有列向量:;其中为所选变量的起始位置,,为选择的最后一个波长变量位置。

    3.根据权利要求1所述的一种基于l2连续投影算法的libs波长筛选方法,其特征在于,步骤7中所述带l2正则化约束的多元线性回归模型是指在多元线性回归模型的基础上增加了l2正则化项;其中,所述多元线性回归模型为:

    4.一种基于l2连续投影算法的libs波长筛选系统,用于实现权利要求1所述的一种基于l2连续投影算法的libs波长筛选方法,其特征在于,包括光谱采集设备模块、数据预处理模块、划分数据集模块、l2连续投影算法筛选特征模块;


    技术总结
    本发明提供一种基于L2连续投影算法的LIBS波长筛选方法,涉及光谱分析技术领域,本发明针对光谱数据维度过高带来的数据冗余以及自吸收和基体效应造成的多重共线性问题,提出一种L2正则化连续投影算法以提高定量分析精度。具体步骤为:(1)对样本进行数据预处理和划分;(2)使用连续投影算法进行特征波长筛选,获得多个变量子集;(3)对多个变量子集使用带L2正则项约束的多元线性回归进行建模,计算交叉验证均方根误差,以获得最优变量子集,最优变量子集即为L2连续投影算法筛选出的波长变量集合。本发明提供了一种降低数据维度同时降低数据间多重共线性问题的解决方法,在传统连续投影算法基础上进一步降低了多重共线性。

    技术研发人员:辛勇,张奇,丛智博,郭美亭,李洋
    受保护的技术使用者:沈阳尖科智能测控技术合伙企业(有限合伙)
    技术研发日:
    技术公布日:2024/4/29
    转载请注明原文地址:https://wp.8miu.com/read-86923.html

    最新回复(0)