本发明涉及大数据挖掘的复杂工业过程智能化技术领域,尤其涉及一种基于历史数据分析的食用油碱炼工艺智能调节方法。
背景技术:
食用油碱炼工艺过程是一个存在化学变化与物理变化、干扰因素难以精确定位的典型复杂工业过程。当前,精炼生产线中和工段采用人工调节的方式,待加工毛油是按批次输入精炼工厂,每批毛油因油品不同则需要班长在换油阶段通过试机调节,设定适合该批次油的生产工艺参数,换油阶段通过调节磷酸添加量、碱添加量、脱皂离心机的向心泵开度及轻向压力等关键工艺参数达到适合该批次毛油的生产设定值;生产过程中当出现化验值反馈油品不合格时需要根据观测到的反馈状态做相应调整,以达到得油率最大的目标。当前依据人工经验调节的方式无法实现精确的量化计算,只有基本的方向性调节规则,需要分析大量的历史生产数据,找出各关键工艺参数跟得油率的量化关系,根据不同工况给出最佳的工艺参数设定值,在保证油品合格的前提下最大限度的提高得油率。而且每批次油因缺乏搅拌可能致使油品分层导致品质在一定幅度内发生变化,要到达产油率最大值,则需根据不同油品适时调节关键参数,这是当前生产工艺人工调节所不具备的。
技术实现要素:
本发明提出一种油脂精炼厂中和工段碱炼工艺最优调节方法,通过智能调节酸碱添加量、脱皂离心机的向心泵开度及轻向压力等关键工艺参数,达到中和工段酸碱反应平衡并稳定脱皂离心机分离效果,减少目前生产工艺参数调节对人工经验的依赖,达到稳定、高效生产,最终提高生产线得油率的目标。
为了实现上述目的,本发明采用如图1所示的方案框架,主要包括以下主要内容:
首先,建立xgboost得油率预测模型,然后,根据历史得油率跟关键参数设置区间的历史数据,找出不同油品下的最高得油率参数区间,作为参数组合寻优模块ga算法寻优约束区间,最后,基于专家经验跟规则挖掘算法获取现场调节规则,对自适应退火遗传算法输出结果进行约束校正。
拼接表,所述拼接表主要指深入分析工艺过程,找出影响食用油质量的dcs数据跟化验数据,将dcs数据、化验数据和油品质量数据基于时间对齐拼接成原始拼接表,形成拼接表的过程也称为数据集成。
决策表,所述决策表是指对拼接表进行预处理,针对无效值和缺失值处理,采用滤波算法来剔除异常值,去除冗余和矛盾数据,精确计算各参数之间的时间延迟关系,形成大数据决策表。
特征提取,将连续值决策表离散化后采用属性约简算法挖掘关键属性。
寻优区间,所述寻优区间以得油率为评价指标,采用聚类算法将历史得油率数据划分为高得油率,低得油率与普通三类,然后找出高得油率对应的设置参数,并通过图表统计将高得油率操作区间与低得油率设定区间分隔开,将高得油率操作区间作为ga算法的关键工艺参数搜索区间。
xgboot得油率预测建模,基于决策表训练xgboost模型,根据关键工艺指标预测当前得油率。
ga参数寻优,所述参数寻优是指采用遗传算法在寻优区间内搜索保证最高得油率的关键工艺参数,遗传算法以xgboost得油率预测值作为目标,在寻优区间内找出一组保证最高得油率的工艺参数组合。
整理专家经验规则,将决策表离散化,采用关联关系挖掘算法、粗糙集上下近似集方法或者决策树等规则挖掘算法基于离散决策表挖掘专家操作规则,整合现场搜集的人工经验形成碱炼工艺操作规则。
主要包括:机理规则约束,所述规则用于对工艺参数组合寻优模块输出的组合推荐参数进行机理约束,使推荐值符合现场工艺:
a、离心机参数约束模块,基于专家经验,脱皂离心机轻向压力与向心开度单次调节区间需小于某阈值,该区间约束模块通过调节ga搜索区间使推荐调节值与当前设定值的差值小于设定阈值;
b、加碱趋势约束模块,基于生产工艺机理与专家经验,加碱量调节趋势需与基于工艺机理经验趋势一致。该趋势约束模块通过概率投票表决约束推荐系统输出碱流量推荐值;
c、遗传算法给出的调节逻辑必须符合现场调节制度。
与现有技术相比,本发明所采用的技术方案具有以下优点:
1、可根据实时生产参数预测出产品的优劣评判标准指标,从而在线实时指导工艺调整工况参数;
2、提供一种智能调节方法,实现灵活性大,系统可维护性强,成本低调试方便,灵活性高,尤其是效率很高,克服了人工检测时间长和高成本,误差大等缺点;
3、将遗传算法跟xgboost预测模型结合对控制参数进行调节,较好的解决了模型预测控制和工业系统普遍存在的实时性产生的控制参数难以整定问题;
4、建立的算法体系可以自动的搜寻最适合的控制参数,不仅节约了大量的人力资源,还在一定程度上优化了控制器的控制效果,提高了系统的自动化水平;
5、通过优化算法寻找的参数最优解,可以为缺少丰富经验的工作者提供可靠的理论依据,提高设计质量,既保证了计算精度,又加快了生产速度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明碱炼工艺智能调节工序整体方案框架图。
图2为本发明碱炼工艺智能调节工序工艺图。
图3为本发明智能推荐功能界面。
图4为本发明得油率对比图。
图5为本发明调整规则图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图2为本发明的实施例的工序工艺图,工艺过程包括:
首先将毛油倒入毛油罐,毛油罐中的毛油主要含有磷脂,色素、金属离子、游离脂肪酸、固体杂质,碱炼工序主要除去磷脂和游离脂肪酸;其次将毛油在加热情况下加入磷酸将不溶于水的磷脂变成水溶性磷脂(加热及搅拌,加快化学反应速度);然后加入稀烧碱,利用碱与油中的游离脂肪酸起中和反应(皂化反应),生成钠盐和水,生成的钠盐在油中不易溶解,成为絮状物而沉降;再通过脱皂离心机利用向心泵开度将絮状物及固体杂质把清油跟沉淀物分开,调节轻向压力大小来控制清油跟沉淀物分开的界面;然后利用磷脂等脂类物分子中含有亲水基,加入热水(去掉溶于水的脂肪酸),同时加入适量柠檬酸来中和残余的磷脂,水化后的磷脂及其他胶体物质周围吸引水分子后,在油脂中溶解度减小,形成絮状物;最后通过水洗离心机把沉淀物跟油在水洗离心机中分离,得到水洗油。
成品油质量和得油率的影响因素:
1、毛油量多少及毛油中磷脂的含量和酸前酸价大小影响磷酸添加量的多少,磷酸添加量过多会导致酸后酸价过低,含磷量过多,添加量过少会导致大量磷脂未能溶于水影响毛油的得油率;
2、加磷酸后酸价大小影响加碱量的多少,添加过量的碱会与少量的甘三脂发生皂化反应,从而引起练耗的增加从而降低得油率,碱含量过少磷酸或脂肪酸未能完全中和导致酸价过高降低成品油质量;
3、碱浓度大小会对毛油色泽产生影响,通过碱浓度反馈调节加碱量;
4、离心机轻向压力,背压过高会跑油,背压过低达不到分离效果;
5、离心机向心泵开度,开度过大会跑油,开度过小会影响效率;
6、柠檬酸,添加过量导致酸价过低,添加少量会有未中和的磷脂;
7、水量大小及温度控制,温度加快溶解,水量过少脂肪酸等杂质未能溶解影响油品质量,水量过多使油脂颜色较深,产生异味促进酸败,降低油脂的品质;
8、水洗离心机,分离不充分会导致油随洗皂水流出降低得油率。
通过分析这些影响因素得到训练特征如下拼接表表1所示。
表1拼接表
数据拼接:所述拼接表是基于时间对齐将历史数据与其所对应的属性拼接而成,数据拼接是因为食用油精炼工序生产过程中,毛油需要经过酸化、加碱中和、脱皂离心机、水洗等过程,关键参数波动较大,甚至超出合格区间,为实现关键质量参数稳定调节,需要根据实际生产工况预测不同油品得油率,因此需要找出影响油品质量及得油率的关键因素,各关键工序时间节点计算时间延时对齐所选取的标准时间轴并与化验数据拼接;
所述数据对齐是将每一个属性的历史数据在一个时间段采集,通过相同时间段将每个属性的历史数据进行对齐的过程,数据对齐目的为将工序时序信息从数据中提取展平,作为xgboost模型训练使用。
数据预处理:所述数据预处理是指将拼接后的数据去除数据库中异常数据冗余数据、矛盾数据的过程,该过程首先进行离群点去除、空数据去除等基本的预处理操作,然后绘制工况属性的散点图,找出对食用油有直接影响的工况属性,绘制配方实际值与设定值的对比误差散点图,分析各属性精度对食用油品质及得油率的影响度,去除没有变化的列属性、空白缺失值等异常数据,主要包括以下几个步骤:
1、数据清洗:删除换油前后日期的数据、删除任意反应罐液位到0附近数据、过滤掉异常点数据、进行数据平滑处理;
2、数据对齐:将化验值插补升频为2小时、根据反应罐液计算每个工序时间延时、对齐关键反应点时间轴、处理nan和丢失值;
3、特征计算:计算水洗离心机后得油率、计算dcs数值和化验值、将油品进行分类、拼接所有数据。
粗糙集属性约简:所述粗糙集是一种离群的数据预处理算法,目的是减少属性冗余,提高数据模型精度。该算法首先将拼接后工况和油品质量、得油率数据分别离散化,然后去除冗余和矛盾数据,形成决策表形式,然后采用重要度相对算法及分辨矩阵对条件属性进行约简,以下内容基于分辨矩阵的启发式最小约简算法可以解决复杂决策表在进行分辨矩阵约简过程中过大的存储空间的问题。
1、分辨矩阵是一个以主对角线对称的n阶方阵,而矩阵中的每一个元素都是通过分辨函数求出来的,采用分辨矩阵可以方便的求解属性集合的核属性和约简组合,通过算出属性集中的核,可以在不改变原来对象的分类下消去冗余信息。
2、对于一个分辨矩阵
式中,
3、公式提现了两个重要的启发式思想:a、属性在分辨矩阵中出现的次数越多,属性的重要性越大;b、属性出现在分辨矩阵中的项越短,属性的重要性越大。
4、基于分辨矩阵的启发式约简算法如下:
输入:决策表
输出:约简(reduct).
步骤:
a、令约简后得到的属性集合等于条件属性集合,即reduct=r;
b、计算分辨矩阵m,并找出所有不包含核属性的属性组合s;
c、计将所有不包含核属性的属性组合表示为取范式的形式,即:
d、将p转化为析取范式的形式,并计算属性的重要性;
e、选择其中重要性最小的属性a,使得reduct=reduct-{a};
f、判断约简操作是否成立,若成立,删除因条件属性约简而引入的冗余样本和不一致样本,i=i 1,转步骤e;否则恢复约简该属性前的样本数据,结束约简,步骤f步中的判断条件为
图4为深度神经网络训练,优化前后的得油率对比图,可以看出优化前得油率波动较大,得油率不高,优化后得油率波动较小,得油率稳定在0.975左右。
深度网络建模:基于决策表中关键参数跟时间建立模型预测关系(因为采用的模型是多变量线性回归模型,每一个属性跟时间都是一个线性关系,线性系数是通过优化算法寻优得到的),采用两种模型预测分别是深度学习模型跟多变量线性回归模型来结合使用,其中深度学习模型得到的统计模型,优化预测的精度可能会更高,但是用的实际效果比较差,因为深度学习模型只统计结果,不负责工况及工艺机理,这时就需要结合多变量线性回归模型来对其进行约束,多变量线性回归模型会用到自适应退火遗传算法来对结果进行校正。
图5是调整规则图,根据粗糙集配方和工况设备训练神经网络,训练过程中通过不断的增加、删除属性,先找出影响中和工段阶跃变化的配方属性,然后找出导致质量指标波动的工况属性,经多次网络结构和参数的调整以及配方和工况的不同组合训练找出适应度最小的模型到处权值和偏置,从原始数据中由粗糙集等特征提取算法提取关键属性,训练时不同属性组合预测精度不同,需要人工鉴别每种组合的合理性。在粗糙集属性约简的基础上依次筛选对预测结果有帮助的关键属性,不断增加删除属性,最后组成最优良的预测属性组合。具有以下特点:
1、机器学习通过从数据里提取规则或模式来把数据转换成信息;
2、根据化验结果调节脱皂油的酸价,根据经验能调节皂脚形态及洗皂水形态;
3、基于当前的调节规则,能自动调节磷脂含量、脱皂油等最终达到预期效果。
粗糙集上下近似集:下近似集的概念为所有能确切判定是否属于给定类的集合,也就是什么样的条件组合肯定能得到什么样的给定决策,而上近似集的概念为所有能确切判定或者可能判定给定类的集合,即什么样的条件组合可能或者肯定能得到什么样的给定决策。
计算步骤如下:
输入:等价关系r、论域u上的模糊集合a;
输出:a的上下近似集的矩阵表示。
步骤1:表示出等价关系矩阵
步骤2:表示出a的模糊列矩阵
步骤3:计算a的上近似集的矩阵表示:
步骤4:计算a的下近似集的矩阵表示:
粗糙集上下近似几何法挖掘上下近似集,挖掘出来的结果采用机理约束规则对模型预测的结果进行约束,如果结果违背了机理约束,那结果就不能用,只能用上一次的预测结果,如果没有违背机理约束规则,那就取最新的结果,这个最后得到的结果是深度学习模型跟多变量线性回归模型共同作用下的结果,如果两个模型的结果相差不大就可以采用深度学习模型的结果,如果给出的结果相差比较大就采用多变量线性回归模型的结果,如果最后的结果符合机理约束就给出结果,如果最后的结果不符合机理约束就不采用本次结果,采用前一次的预测结果。
专家规则:则比较所述类别中不同模型的评价指标值。其中,设定条件可以是根据经验值设置数值阈值,若评价指标值均小于数值阈值,则认为当前模型类别下所有模型的分析结果均不好,调整模型参数或调整样本数据后,重新进行数据分析,得到数据处理结果。基于数据处理结果重新计算各个模型的评价指标值,再判断新确定的评价指标值是否满足设定条件。按照上述方式进行多次的反复迭代,直至所有评价指标值均满足设定条件。
xgboost预测模型:将所述训练数据集作为预测模型的训练数据,所述预测模型的训练数据包括测试集和训练集,并利用所述训练集对所述xgboost算法的预测模型进行训练,得到xgboost算法的预测模型;检验集带入基于xgboost算法预测模型,得到测试样本对应的实际曲线与预测曲线对比图、残差图和评价指标的计算结果。
步骤如下:
1、从决策表数据提取以2小时为时间间隔的数据作为原始数据集;
2、对总数据进行训练集和检验集的划分;
3、将数据检验集带入训练完成的模型,得到检验样本对应的模型预测曲线与实际得油率曲线;
4、利用ga算法检索得出的最优的参数组合,带入xgboost模型,得出得油率。
遗传算法参数寻优:采用遗传算法进行工艺参数组合寻优,遗传算法模拟了自然选择和遗传中发生的复制、交叉和变异等现象,从任一初始种群出发,通过随机选择、交叉和变异操作,产生一群更适应环境的个体,使群体进化到搜索空间中越来越好的区域,这样一代一代的不断地繁衍进化,最后收敛到一群最适应环境的个体,求得问题的最优解。
推荐值通过自适应退火遗传算法计算,通过xgboost得油率预测模型作为评价指标,基于当前毛油的酸前总酸量与毛油品种所预划分的最优区间中搜索最优组合,产生系统推荐工艺参数。
粗糙集、apriro算法 专家经验得到现场调整规则:机器学习通过从数据里提取规则或模式来把数据转换成信息。能根据化验结果调节脱皂油的酸价,根据经验能调节皂脚形态及洗皂水形态;基于当前的调节规则,能自动调节磷脂含量、脱皂油等最终达到预期效果;
对遗传算法结果采用规则进行约束:通过模拟自然进化过程寻找最优解决办法,使推荐值符合工艺规定单次调节幅度与机理预测趋势。
油脂精炼中和工段加碱量计算:碱添加量由系统计算得到,碱过量系数只影响皂化反应部分的碱量,中和磷酸需要添加的碱量,目前生产控制系统里的计算值缺换算系数1.22。
1、碱常数n:表示1l碱液中有多少oh-,对烧碱naoh来说:
其中碱密度由碱浓度查表得到,碱常数可以方便计算中和的酸量。
2、皂化反应:中和ffa时要考虑碱过量系数。
其中ffa的平均分子量认为是282,1价酸。
3、中和磷酸:按照中和70%的磷酸来算
其中磷酸的分子量是98,3价酸。这和上面中和ffa碱量的是类似的。
另外,也可以写成下面的形式,相当于带入碱常数公式:
其中
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的技术人员来说,在不脱离本发明构思的前提下,还可以做出若干等同替代或明显变型,而且性能或用途相同,都应当视为属于本发明的保护范围。
1.一种基于大数据分析的食用油碱炼工艺智能调节方法,其特征在于:该方法主要包括以下步骤。
2.中和段工艺说明:通过中和反应将油脂中的(磷脂,色素,金属离子,游离脂肪酸,固体杂质)通过碱液与脂肪酸发生中和反应,生成皂从油中分离,但是在碱炼操作中,碱液除与脂肪酸发生中和反应外,过量的碱还会与少量的甘三脂发生皂化反应,从而引起练耗的增加,所以要选择合理比例的碱,减少练耗获得最高得油率。
3.粗糙集分辨矩阵分析影响得油率的关键参数拼接数据表,进行数据预处理,数据清洗与预处理主要包括:a、用于对中粮中和工段dcs采样数据进行无效值和缺失值处理;b、剔除异常工段以及异常值等的数据清洗;c、各关键工序时间节点计算时间延时对齐所选取的标准时间轴并与化验数据拼接;d、以及计算在线实时得油率等关键评价数据。
4.建立xgboost得油率预测模型,主要包括:输入接口跟输出pickle文件,输入接口包含:训练x特征,目标y,其中x特征有:'oil_type',','加碱总量delta','向心泵开度delta','碱流量值delta','中和工段酸前delta','中和工段酸后delta','中和工段脱皂油含皂量delta','中和工段酸前','中和工段酸后','碱液波美度','碱流量值','毛油流量值','磷酸流量值','轻相压力','向心泵开度';目标y为:输入数据结构:pandasdataframe。
5.分析历史得油率数据得到最高得率关键参数区间:通过计算所得oil_rate_24h每日得油率对应区间内日调节设定值划分为高得油率,低得油率与普通三类,并通过图表统计将高得油率操作区间与低得油率设定区间分隔开,整理高得油率操作区间作为工艺参数组合寻优模块的ga算法预搜索区间,保存为pickle文件。
6.自适应模拟退火遗传算法在最高得率参数区间寻优最优得油率参数:使用关键指标预测模块中xgboost得油率预测模型作为fitnessfunction引擎的评价指标,对数据分析模块中,基于当前毛油的酸前总酸量与毛油品种所预划分的最优区间中搜索最优组合,产生系统推荐工艺参数。
7.结合人工经验和粗糙集上下近似集建立最高得油率规则表:优化中粮油脂精炼工厂的中和工段碱炼工艺,通过自动化智能控制调节酸碱添加量、脱皂离心机的向心开度及轻向压力等关键工艺参数,达到中和反应最佳平衡点及稳定脱皂离心机分离效果的生产状态,减少目前生产工艺参数调节对人工经验的依赖,达到稳定、高效生产,最终提高产线得油率的目的。
8.对遗传算法最优得率参数组合通过规则进行约束:遗传算法(geneticalgorithm)是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。
技术总结