一种基于迹距离划分决策树的高炉故障诊断方法

    专利2025-03-22  30


    本发明涉及高炉故障诊断,尤其涉及一种基于迹距离划分决策树的高炉故障诊断方法。


    背景技术:

    1、作为钢铁制造流程的主要工序,高炉炼铁的基本任务是从铁矿石中提取金属铁,这是一个连续且复杂的生产过程,且需要监测大量的参数,如炉顶压力、铁水温度、铁水含量等。然而,与其他工业生产过程不同,高炉本身的生产机理模型十分复杂,涉及气体、固体和液体的共存;监测环境条件恶劣,需要在密闭和高尘的环境下进行操作;炼铁过程状态非平衡、非均一、非稳定、非线性且数据量一般较大。因此需要开发一种简单、高效的高炉故障诊断方法,这对于钢铁工业可持续发展具有重要意义。

    2、随着工业自动化和智能化的发展,利用机器学习技术对高炉故障进行诊断和预测变得越来越重要。决策树模型因其直观、易于解释的特点,在故障诊断领域得到了广泛应用。专利“一种基于样本分割的多尺度二叉树高炉故障诊断方法”(王安娜,沙漠,申请公布号:cn 105550426 a)中利用改进的广义特征值支持向量机算法构建二叉树分类器。然而,现有的决策树模型在构建过程中可能会产生过于复杂的树结构,这不仅增加了模型的计算成本,还可能导致模型对训练数据的过度拟合,从而影响其在高炉故障诊断任务中的诊断性能,不利于故障诊断模型的快速离线迭代和实时在线预测,故障诊断效果难以满足现场的监测和诊断需求。


    技术实现思路

    1、针对现有技术的不足,本发明提供一种基于迹距离划分决策树的高炉故障诊断方法,能够充分利用检测数据,快速构建故障诊断模型,满足高炉在线实时诊断需求。

    2、本发明的技术方案为:

    3、一种基于迹距离划分决策树的高炉故障诊断方法,包括以下步骤:

    4、步骤1:构建高炉故障诊断初始数据集,初始数据集d={xs,ys|xs∈rm,s∈{1,2,...,n}},其中,xs为第s个样本的所有采集项组成的特征向量,ys为第s个样本的故障标签,n为样本个数,m为样本维数,rm表示m维实数空间。

    5、步骤2:对初始数据集进行数据预处理,并进行拆分,得到预处理后的训练集dtrain和测试集dtest;

    6、步骤2.1:使用箱线图进行异常值处理:针对初始数据集d中的每个采集项对应的特征向量xs,计算特征向量xs中所有值的上四分位数q3、中位数q2、下四分位数q1,接着计算箱线图的上限和下限,上限的计算公式为:q3+1.5(q3-q1),下限的计算公式为:q1-1.5(q3-q1),将特征向量xs中所有取值大于上限和低于下限的点用该特征向量的均值替换;

    7、步骤2.2:从异常值处理后的数据集中随机选取75%的样本作为训练集dtrain,将剩下的25%的样本作为测试集dtest;

    8、步骤3:构建基于迹距离函数的划分标准,计算当前划分的迹距离f值;

    9、步骤3.1:将训练集dtrain作为当前数据集,其中数据集的样本个数用n表示,样本维数用m表示,故障标签类别数用k表示,计算矩阵q;

    10、步骤3.1.1:根据训练集dtrain已有的故障标签,计算矩阵其中k表示当前训练集的故障标签类别数,对于矩阵a,当i≠j时,aij=0,即非对角线元素为0,其中i,j=1,2,...,k,分别表示第i类以及第j类故障标签;aii表示第i类故障标签的样本个数,且∑iaii=n,其中n表示样本个数;

    11、步骤3.1.2:根据步骤3.1.1得到的矩阵a,进一步计算矩阵其中qii表示每类标签的样本在当前数据集样本个数中所占的比例,则概率和为1,即对角线元素和为1;

    12、步骤3.2:将训练集dtrain作为当前数据集,其中数据集的样本个数用n表示,样本维数用m表示,故障标签类别数用k表示,计算矩阵p:

    13、步骤3.2.1:根据训练集dtrain中的样本特征对当前数据集进行分类,把dtrain中的第t个特征xt的第s个元素记作其中n表示训练集的样本个数,m表示样本维数。按照的大小将当前数据集划分为两个子数据集,即将xt中大于的元素所对应的样本划分到左节点中,将xt中小于等于的元素所对应的样本划分到右节点中,以子节点下的数据集中出现频率最高的标签作为该子节点的故障诊断标签,将划分后两个子节点的故障诊断标签与真实故障标签进行对比,计算矩阵其中bij表示把第i类故障标签的样本分到第j类故障中的个数,且∑ijbij=n,i,j=1,2,...,k;

    14、步骤3.2.2:根据步骤3.2.1得到的矩阵b,进一步计算矩阵其中pij表示bij在当前数据集样本个数中所占的比例,且∑ijpij=1,则矩阵p的元素和为1,即概率和等于1;

    15、步骤3.3:根据下式计算当前划分的迹距离f值:

    16、

    17、其中tr(·)表示矩阵的迹,当分类完全正确时,即当p=q时,当分类不完全正确的情况,即当p≠q时,

    18、步骤4:选择迹距离f值最小的特征及其对应的分割点最为最优特征和最优分割点;

    19、步骤4.1:根据训练集,对dtrain中的每个特征进行遍历,得到每个特征下最小迹距离f值:

    20、步骤4.1.1:对dtrain中的第t个特征进行遍历,其中t=1,..,m,m表示样本维数,n表示当前数据集的样本个数,计算在特征xt不同元素下的迹距离f值

    21、步骤4.1.2:计算步骤4.1.1中得到的特征xt不同元素下的最小迹距离f值,即

    22、步骤4.2:根据训练集dtrain,对dtrain中的每个特征进行遍历,得到在所有特征下的最小迹距离f值,即f=min(f1,f2,…,fm),其中m表示当前数据集的样本维数,选择该迹距离f值下对应的特征作为最优特征,其对应的分割点作为最优分割点;

    23、步骤5:生成基于迹距离划分的决策树模型;

    24、步骤5.1:按照最优特征与最优分割点,从根结点生成两个子节点,将当前数据集中的样本分配到左右两个子节点中;

    25、步骤5.2:判断左右两个子节点是否满足停止条件,若不满足,则对两个子节点递归调用步骤3、步骤4,直至满足停止条件,若满足停止条件,则输出基于迹距离划分的决策树模型:

    26、停止计算的条件是当前结点中的样本个数小于预定的阈值δ,或当前结点下的数据集的迹距离f值小于预定的阈值ε;

    27、步骤6:实时采集高炉炼铁生产过程数据,将其输入到步骤5中得到的基于迹距离划分的决策树故障诊断模型中,通过诊断模型对当前高炉的故障进行诊断,若监测到故障发生,则模型将发生故障的类别推送给现场操作人员,及时对高炉生产过程进行调节。

    28、采用上述技术方案所产生的有益效果在于:

    29、本发明提供一种基于迹距离划分决策树的高炉故障诊断方法,当对决策树的节点分裂时,采用基于迹距离的划分标准来替代传统cart树中的基于基尼指数的划分标准,该方法一方面能够更快速地评价一个节点的划分效果,减少决策树模型的训练时间,另一方面也能够降低决策树模型的复杂度,并获得更高的诊断精度。经过高炉实际生产数据的实验测试,相较于传统方法,本发明的方法能够在更短的训练时间内,取得最优的高炉故障诊断效果,能够帮助现场操作人员提前预知可能发生的高炉故障,及时对高炉生产过程进行调节,避免出现严重的高炉生产事故,从而提高钢铁企业的生产效率。


    技术特征:

    1.一种基于迹距离划分决策树的高炉故障诊断方法,其特征在于,包括以下步骤:

    2.根据权利要求1所述的一种基于迹距离划分决策树的高炉故障诊断方法,其特征在于,步骤1中所述初始数据集d={xs,ys|xs∈rm,s∈{1,2,...,n}},其中,xs为第s个样本的所有采集项组成的特征向量,ys为第s个样本的故障标签,n为样本个数,m为样本维数,rm表示m维实数空间。

    3.根据权利要求1所述的一种基于迹距离划分决策树的高炉故障诊断方法,其特征在于,所述步骤2具体包括:

    4.根据权利要求1所述的一种基于迹距离划分决策树的高炉故障诊断方法,其特征在于,所述步骤3具体包括以下步骤:

    5.根据权利要求1所述的一种基于迹距离划分决策树的高炉故障诊断方法,其特征在于,所述步骤4具体包括以下步骤:

    6.根据权利要求1所述的一种基于迹距离划分决策树的高炉故障诊断方法,其特征在于,所述步骤5具体包括以下步骤:

    7.根据权利要求6所述的一种基于迹距离划分决策树的高炉故障诊断方法,其特征在于,步骤5.2中停止条件是当前结点中的样本个数小于预定的阈值δ,或当前结点下的数据集的迹距离f值小于预定的阈值ε。


    技术总结
    本发明提供一种基于迹距离划分决策树的高炉故障诊断方法,涉及高炉故障诊断技术领域,本发明从高炉生产过程数据采集系统中获取所需数据集,从企业服务器中获取历史生产过程数据,并用该数据建立基于迹距离划分的决策树高炉故障诊断模型;然后从高炉生产过程数据采集系统中获取各采样点上的实时采样值,得到高炉在线生产过程数据,将在线数据传递给高炉故障诊断模型,从而向现场操作人员输出当前高炉炉况的在线诊断结果;此外,高炉生产过程数据采集系统会将所有新采样的样本储存在企业服务器中,当新样本的数量满足要求时,会结合历史数据和新数据来重新训练高炉故障诊断模型,保证模型能够跟踪诊断高炉的最新工况。

    技术研发人员:刘亚雪,王显鹏
    受保护的技术使用者:东北大学
    技术研发日:
    技术公布日:2024/4/29
    转载请注明原文地址:https://wp.8miu.com/read-84388.html

    最新回复(0)