本发明涉及电力技术领域,具体为一种基于xgboost模型预测储能系统中锂电池剩余循环寿命的方法。
背景技术:
随着电化学储能电站数量的增加,电化学电站的远程运维管理变得十分重要,电化学储能电站寿命对电站的运维和经济效益都有重要作用,而目前如何通过评估电池的生命周期,对电池的失效实现预判和预处理,一直是远程运维工作难点,若能够通过远程收集的电化学储能电站中电池运行数据进行统计分析,建立电池的寿命预估模型,提前预知其寿命,指导电站的运维工作,对于保障电站正常工作,提高经济效益和电站的安全可靠性具有十分重要的意义。
目前行业中对锂电池循环寿命的预测方法主要是基于模型的寿命预测,基于模型的剩余寿命预测方法已经较为成熟,依托于对电池负载条件、材料属性及退化机理结合电池失效机制实现剩余寿命的预测,包括退化机理模型、等效电路模型、经验退化模型等,但是这些研究方法是针对特定及固定工况使用环境的锂电池,而储能电站锂电池的使用工况及环境同上述相比具有明显的差异性,同时由于储能电站持续运行、锂电池成组排列且数量众多,无法对锂电池进行拆解并一一单独测试,故仅能通过储能过程采集的锂电池运行数据进行分析和预测,不能满足人们的要求。
技术实现要素:
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种基于xgboost模型预测储能系统中锂电池剩余循环寿命的方法,主要为解决现有储能电站持续运行、锂电池成组排列且数量众多,无法对锂电池进行拆解并一一单独测试,故仅能通过储能过程采集的锂电池运行数据进行分析和预测的问题。
(二)技术方案
为实现上述目的,本发明提供如下技术方案:
一种基于xgboost模型预测储能系统中锂电池剩余循环寿命的方法,包括以下步骤:
s1:数据采集,采集储能电站运行过程中锂电池的实际运行数据;
s2:数据清洗,对采集的数据进行整理;
s3:特征选择,通过计算原始数据构造特征数据,并分析特征数据间的相关性;
s4:模型选择,选择xgboost模型,对锂电池的剩余循环寿命进行预测;
s5:模型训练及评价,将数据集按八二的比例分为训练集和测试集,选取部分模型具体参数,并进行训练评分;
s6:模型输出,根据s5中得到的模型,将模型保存待用;
s7:寿命预测,根据训练得到的模型,对储能电站锂电池的剩余循环寿命进行预测。
在前述方案的基础上,所述s1中采集储能电站锂电池的原始运行数据,锂电池以单簇电池为基本单元,采集单簇电池的电池簇soc、电池簇soh、电池簇最低温度、电池簇最高温度、电池簇平均温度、电池簇最低电压、电池簇最高电压、电池簇平均电压、电池簇总电压、电池簇日充电电量、电池簇日放电电量、电池簇最大允许充电电流、电池簇最大允许放电电流、电池簇状态、电池簇电流、电池簇累计充放电次数,数据采集时间间隔为2-7s,值取时间间隔最新值。
作为本发明再进一步的方案,所述s2中在数据清洗时考虑锂电池在满充满放状态,删除未满充满放数据、删除采样的异常值、空值,保留满充满放状态下的锂电池运行数据。
进一步的,所述s3中在选择特征时原始数据均为随时间变化的数据,分析储能电站锂电池每日的充电时段数据,提取每日的以下9个原始特征数据,特征数据分别为:
充电电量:充电结束充电量-充电开始充电量
充电时长:充电结束时间–充电开始时间
soc极差:充电结束soc–充电开始soc
电压极差最大值:电池簇电压极差最大值
电压极差均值:电池簇电压极差平均值
温度极差最大值:电池簇温度极差最大值
温度极差均值:电池簇温度极差平均值
电流均值:充电电流平均值
累计充电次数:锂电池累计充放电次数。
在前述方案的基础上,所述s3中选取锂电池充电电量作为因变量y,选取锂电池充电时长、soc极差、电压极差最大值、电压极差均值、温度极差最大值、温度极差均值、电流均值、累计充电次数作为自变量x。
本发明再进一步的方案,所述s4中采用xgboost模型,xgboost的算法思想是不断地添加树,不断地进行特征分裂来生长一棵树,每次添加一个树,当训练完成得到k棵树,我们要预测一个样本的分数,其实就是根据这个样本的特征,在每棵树中会落到对应的一个叶子节点,每个叶子节点就对应一个分数,最后只需要将每棵树对应的分数加起来就是该样本的预测值;
需要学习k树,就要最小化下面这个带正则项的目标函数,目标函数为:
上式中
进一步的,所述s5中采用python的第三方xgboost库,参数调参范围。
在前述方案的基础上,所述s7中在进行寿命预测时根据输出的模型,做电池簇的剩余循环寿命,步骤如下:首先除累计充电次数外,其余自变量采用移动平均法计算一定时间段后的预估值,然后累计充放电次数增加对应相差天数,最后将自变量作为输入代入模型,由模型计算出锂电池的日充电电量。
(三)有益效果
与现有技术相比,本发明提供了一种基于xgboost模型预测储能系统中锂电池剩余循环寿命的方法,具备以下有益效果:
1、本发明中采用应用广泛的寿命预测大数据模型,模型成熟、预测准确率高,采用调参优化方法,确定模型最优参数,提升预测模型的准确性,避免过拟合和欠拟合情形。
2、本发明中采用大数据预测方法预测储能电站的锂电池剩余循环寿命预测,数据样本量大,提高了预测的精准性,储能电站锂电池的数据采集点多,采集的锂电池运行数据数量大、种类多、时间跨度长,数据获取简便,省时省力。
3、本发明中采用科学的方法对采集的原始数据进行数据清洗和特征提取,特征间相关性分析可更直观看到特征间相互关系,找出影响锂电池剩余循环寿命的重要因素。
4、通过在节点内选择最佳分裂点,候选分裂点计算增益用多线程并行,提高训练速度,添加了对稀疏数据的处理,可以交叉验证,earlystop,当预测结果已经很好的时候可以提前停止建树,加快训练速度,支持设置样本权重,该权重体现在一阶导数g和二阶导数h,通过调整权重可以去更加关注一些样本。
附图说明
图1为本发明提出的一种基于xgboost模型预测储能系统中锂电池剩余循环寿命的方法的流程结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
参照图1,一种基于xgboost模型预测储能系统中锂电池剩余循环寿命的方法,包括以下步骤:
s1:数据采集,采集储能电站运行过程中锂电池的实际运行数据,包括电池簇电压、电池簇温度、电池簇电流、电池簇累计充放电次数等可用数据;
s2:数据清洗,对采集的数据进行整理,去除无效、异常、部分缺失的数据,保留有效的数据;
s3:特征选择,通过计算原始数据构造特征数据,并分析特征数据间的相关性,作出取舍,选取合适的特征数据作为模型的输入和输出;
s4:模型选择,选择xgboost模型,对锂电池的剩余循环寿命进行预测,采用应用广泛的寿命预测大数据模型,模型成熟、预测准确率高;
s5:模型训练及评价,将数据集按八二的比例分为训练集和测试集,选取10个模型具体参数,每个参数选取5-10个数值进行分别训练评分,模型评价标准采用决定系数r^2,采用调参优化方法,确定模型最优参数,提升预测模型的准确性,避免过拟合和欠拟合情形;
s6:模型输出,根据s5中得到的模型,将模型保存待用;
s7:寿命预测,根据训练得到的模型,对储能电站锂电池的剩余循环寿命进行预测。
本发明的s1中采集储能电站锂电池的原始运行数据,锂电池以单簇电池为基本单元,采集单簇电池的电池簇soc、电池簇soh、电池簇最低温度、电池簇最高温度、电池簇平均温度、电池簇最低电压、电池簇最高电压、电池簇平均电压、电池簇总电压、电池簇日充电电量、电池簇日放电电量、电池簇最大允许充电电流、电池簇最大允许放电电流、电池簇状态、电池簇电流、电池簇累计充放电次数,数据采集时间间隔为5s,值取时间间隔最新值,采用大数据预测方法预测储能电站的锂电池剩余循环寿命预测,数据样本量大,提高了预测的精准性,储能电站锂电池的数据采集点多,采集的锂电池运行数据数量大、种类多、时间跨度长,数据获取简便,省时省力,s2中在数据清洗时考虑锂电池在满充满放状态,删除未满充满放数据、删除采样的异常值、空值,保留满充满放状态下的锂电池运行数据,同时,考虑到满充满放状态下电池的充电与放电过程类似,故提取充电时段数据进行分析,最终保留满充满放状态下锂电池充电时段各项数据,s3中在选择特征时原始数据均为随时间变化的数据,分析储能电站锂电池每日的充电时段数据,提取每日的以下9个原始特征数据,特征数据分别为:
充电电量:充电结束充电量-充电开始充电量
充电时长:充电结束时间–充电开始时间
soc极差:充电结束soc–充电开始soc
电压极差最大值:电池簇电压极差最大值
电压极差均值:电池簇电压极差平均值
温度极差最大值:电池簇温度极差最大值
温度极差均值:电池簇温度极差平均值
电流均值:充电电流平均值
累计充电次数:锂电池累计充放电次数;采用科学的方法对采集的原始数据进行数据清洗和特征提取,特征间相关性分析可更直观看到特征间相互关系,找出影响锂电池剩余循环寿命的重要因素。
需要特别说明的是,s3中选取锂电池充电电量作为因变量y,选取锂电池充电时长、soc极差、电压极差最大值、电压极差均值、温度极差最大值、温度极差均值、电流均值、累计充电次数作为自变量x,s4中采用xgboost模型,xgboost是boosting算法的其中一种,boosting算法的思想是将许多弱分类器集成在一起,形成一个强分类器,因为xgboost是一种提升树模型,所以它是将许多树模型集成在一起,形成一个很强的分类器,而所用到的树模型则是cart回归树模型,xgboost的算法思想是不断地添加树,不断地进行特征分裂来生长一棵树,每次添加一个树,当训练完成得到k棵树,我们要预测一个样本的分数,其实就是根据这个样本的特征,在每棵树中会落到对应的一个叶子节点,每个叶子节点就对应一个分数,最后只需要将每棵树对应的分数加起来就是该样本的预测值,需要学习k树,就要最小化下面这个带正则项的目标函数,目标函数为:
上式中
模型评价采用决定系数r^2,决定系数反应了y的波动有多少百分比能被x的波动所描述,即表征变数y的变异中有多少百分比,可由控制的自变数x来解释,拟合优度越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高,观察点在回归直线附近越密集,取值范围为[0,1],计算公式如下:
r2=ssr/sst=1-sse/sst
其中:sst=ssr sse,sst(totalsumofsquares)为总平方和,ssr(regressionsumofsquares)为回归平方和,sse(errorsumofsquares)为残差平方和。
为电池簇实际充电电量,其均值为,模型拟合的电池簇充电电量为,记:
总平方和(sst):
回归平方和(ssr):
残差平方和(sse):
则有:sst=ssr sse
决定系数为:
最终经过参数调整,评价得分最高的参数设置如下:
seed=144,
n_estimators=290,
max_depth=3,
eval_metric='rmse',
learning_rate=0.2,
min_child_weight=1,
subsample=0.8,
colsample_bytree=0.9,
colsample_bylevel=1,
gamma=0.7,
reg_alpha=0.7,
reg_lambda=1
s7中在进行寿命预测时根据输出的模型,做电池簇的剩余循环寿命,步骤如下:首先除累计充电次数外,其余自变量采用移动平均法计算一定时间段后的预估值,然后累计充放电次数增加对应相差天数,最后将自变量作为输入代入模型,由模型计算出锂电池的日充电电量。
实施例2
参照图1,一种基于xgboost模型预测储能系统中锂电池剩余循环寿命的方法,包括以下步骤:
s1:数据采集,采集储能电站运行过程中锂电池的实际运行数据,包括电池簇电压、电池簇温度、电池簇电流、电池簇累计充放电次数等可用数据;
s2:数据清洗,对采集的数据进行整理,去除无效、异常、部分缺失的数据,保留有效的数据;
s3:特征选择,通过计算原始数据构造特征数据,并分析特征数据间的相关性,作出取舍,选取合适的特征数据作为模型的输入和输出;
s4:模型选择,选择xgboost模型,对锂电池的剩余循环寿命进行预测,采用应用广泛的寿命预测大数据模型,模型成熟、预测准确率高;
s5:模型训练及评价,将数据集按八二的比例分为训练集和测试集,选取12个模型具体参数,每个参数选取5-10个数值进行分别训练评分,模型评价标准采用决定系数r^2,采用调参优化方法,确定模型最优参数,提升预测模型的准确性,避免过拟合和欠拟合情形;
s6:模型输出,根据s5中得到的模型,将模型保存待用;
s7:寿命预测,根据训练得到的模型,对储能电站锂电池的剩余循环寿命进行预测。
本发明的s1中采集储能电站锂电池的原始运行数据,锂电池以单簇电池为基本单元,采集单簇电池的电池簇soc、电池簇soh、电池簇最低温度、电池簇最高温度、电池簇平均温度、电池簇最低电压、电池簇最高电压、电池簇平均电压、电池簇总电压、电池簇日充电电量、电池簇日放电电量、电池簇最大允许充电电流、电池簇最大允许放电电流、电池簇状态、电池簇电流、电池簇累计充放电次数,数据采集时间间隔为4s,值取时间间隔最新值,采用大数据预测方法预测储能电站的锂电池剩余循环寿命预测,数据样本量大,提高了预测的精准性,储能电站锂电池的数据采集点多,采集的锂电池运行数据数量大、种类多、时间跨度长,数据获取简便,省时省力,s2中在数据清洗时考虑锂电池在满充满放状态,删除未满充满放数据、删除采样的异常值、空值,保留满充满放状态下的锂电池运行数据,同时,考虑到满充满放状态下电池的充电与放电过程类似,故提取充电时段数据进行分析,最终保留满充满放状态下锂电池充电时段各项数据,s3中在选择特征时原始数据均为随时间变化的数据,分析储能电站锂电池每日的充电时段数据,提取每日的以下9个原始特征数据,特征数据分别为:
充电电量:充电结束充电量-充电开始充电量
充电时长:充电结束时间–充电开始时间
soc极差:充电结束soc–充电开始soc
电压极差最大值:电池簇电压极差最大值
电压极差均值:电池簇电压极差平均值
温度极差最大值:电池簇温度极差最大值
温度极差均值:电池簇温度极差平均值
电流均值:充电电流平均值
累计充电次数:锂电池累计充放电次数;采用科学的方法对采集的原始数据进行数据清洗和特征提取,特征间相关性分析可更直观看到特征间相互关系,找出影响锂电池剩余循环寿命的重要因素。
需要特别说明的是,s3中选取锂电池充电电量作为因变量y,选取锂电池充电时长、soc极差、电压极差最大值、电压极差均值、温度极差最大值、温度极差均值、电流均值、累计充电次数作为自变量x,s4中采用xgboost模型,xgboost是boosting算法的其中一种,boosting算法的思想是将许多弱分类器集成在一起,形成一个强分类器,因为xgboost是一种提升树模型,所以它是将许多树模型集成在一起,形成一个很强的分类器,而所用到的树模型则是cart回归树模型,xgboost的算法思想是不断地添加树,不断地进行特征分裂来生长一棵树,每次添加一个树,当训练完成得到k棵树,我们要预测一个样本的分数,其实就是根据这个样本的特征,在每棵树中会落到对应的一个叶子节点,每个叶子节点就对应一个分数,最后只需要将每棵树对应的分数加起来就是该样本的预测值,需要学习k树,就要最小化下面这个带正则项的目标函数,目标函数为:
上式中
模型评价采用决定系数r^2,决定系数反应了y的波动有多少百分比能被x的波动所描述,即表征变数y的变异中有多少百分比,可由控制的自变数x来解释,拟合优度越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高,观察点在回归直线附近越密集,取值范围为[0,1],计算公式如下:
r2=ssr/sst=1-sse/sst
其中:sst=ssr sse,sst(totalsumofsquares)为总平方和,ssr(regressionsumofsquares)为回归平方和,sse(errorsumofsquares)为残差平方和。
为电池簇实际充电电量,其均值为,模型拟合的电池簇充电电量为,记:
总平方和(sst):
回归平方和(ssr):
残差平方和(sse):
则有:sst=ssr sse
决定系数为:
最终经过参数调整,评价得分最高的参数设置如下:
seed=144,
n_estimators=290,
max_depth=3,
eval_metric='rmse',
learning_rate=0.2,
min_child_weight=1,
subsample=0.8,
colsample_bytree=0.9,
colsample_bylevel=1,
gamma=0.7,
reg_alpha=0.7,
reg_lambda=1
s7中在进行寿命预测时根据输出的模型,做电池簇的剩余循环寿命,步骤如下:首先除累计充电次数外,其余自变量采用移动平均法计算一定时间段后的预估值,然后累计充放电次数增加对应相差天数,最后将自变量作为输入代入模型,由模型计算出锂电池的日充电电量。
在该文中的描述中,需要说明的是,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
1.一种基于xgboost模型预测储能系统中锂电池剩余循环寿命的方法,其特征在于,包括以下步骤:
s1:数据采集,采集储能电站运行过程中锂电池的实际运行数据;
s2:数据清洗,对采集的数据进行整理;
s3:特征选择,通过计算原始数据构造特征数据,并分析特征数据间的相关性;
s4:模型选择,选择xgboost模型,对锂电池的剩余循环寿命进行预测;
s5:模型训练及评价,将数据集按八二的比例分为训练集和测试集,选取部分模型具体参数,并进行训练评分;
s6:模型输出,根据s5中得到的模型,将模型保存待用;
s7:寿命预测,根据训练得到的模型,对储能电站锂电池的剩余循环寿命进行预测。
2.根据权利要求1所述的一种基于xgboost模型预测储能系统中锂电池剩余循环寿命的方法,其特征在于,所述s1中采集储能电站锂电池的原始运行数据,锂电池以单簇电池为基本单元,采集单簇电池的电池簇soc、电池簇soh、电池簇最低温度、电池簇最高温度、电池簇平均温度、电池簇最低电压、电池簇最高电压、电池簇平均电压、电池簇总电压、电池簇日充电电量、电池簇日放电电量、电池簇最大允许充电电流、电池簇最大允许放电电流、电池簇状态、电池簇电流、电池簇累计充放电次数,数据采集时间间隔为2-7s,值取时间间隔最新值。
3.根据权利要求2所述的一种基于xgboost模型预测储能系统中锂电池剩余循环寿命的方法,其特征在于,所述s2中在数据清洗时考虑锂电池在满充满放状态,删除未满充满放数据、删除采样的异常值、空值,保留满充满放状态下的锂电池运行数据。
4.根据权利要求3所述的一种基于xgboost模型预测储能系统中锂电池剩余循环寿命的方法,其特征在于,所述s3中在选择特征时原始数据均为随时间变化的数据,分析储能电站锂电池每日的充电时段数据,提取每日的以下9个原始特征数据,特征数据分别为:
充电电量:充电结束充电量-充电开始充电量
充电时长:充电结束时间–充电开始时间
soc极差:充电结束soc–充电开始soc
电压极差最大值:电池簇电压极差最大值
电压极差均值:电池簇电压极差平均值
温度极差最大值:电池簇温度极差最大值
温度极差均值:电池簇温度极差平均值
电流均值:充电电流平均值
累计充电次数:锂电池累计充放电次数。
5.根据权利要求1所述的一种基于xgboost模型预测储能系统中锂电池剩余循环寿命的方法,其特征在于,所述s3中选取锂电池充电电量作为因变量y,选取锂电池充电时长、soc极差、电压极差最大值、电压极差均值、温度极差最大值、温度极差均值、电流均值、累计充电次数作为自变量x。
6.根据权利要求1所述的一种基于xgboost模型预测储能系统中锂电池剩余循环寿命的方法,其特征在于,所述s4中采用xgboost模型,xgboost的算法思想是不断地添加树,不断地进行特征分裂来生长一棵树,每次添加一个树,当训练完成得到k棵树,我们要预测一个样本的分数,其实就是根据这个样本的特征,在每棵树中会落到对应的一个叶子节点,每个叶子节点就对应一个分数,最后只需要将每棵树对应的分数加起来就是该样本的预测值;
需要学习k树,就要最小化下面这个带正则项的目标函数,目标函数为:
上式中
7.根据权利要求1所述的一种基于xgboost模型预测储能系统中锂电池剩余循环寿命的方法,其特征在于,所述s5中采用python的第三方xgboost库,参数调参范围。
8.根据权利要求7所述的一种基于xgboost模型预测储能系统中锂电池剩余循环寿命的方法,其特征在于,所述s7中在进行寿命预测时根据输出的模型,做电池簇的剩余循环寿命,步骤如下:首先除累计充电次数外,其余自变量采用移动平均法计算一定时间段后的预估值,然后累计充放电次数增加对应相差天数,最后将自变量作为输入代入模型,由模型计算出锂电池的日充电电量。
技术总结