一种配电网线损预测方法及系统与流程

    专利2022-07-08  108


    本申请实施例涉及配电网线损分析管理技术领域,特别涉及一种配电网线损预测方法及系统。



    背景技术:

    近年来,随着电力设备增多,我国配电网规模不断增大,然而配电损耗问题随着负荷容量的不断提升而日趋严重,由于配电网线损增大会导致发电和输电设备容量增加,因此造成电力成本提高和电力资源浪费。我国配电网发展结构不合理,配电损耗管理缺乏指导,目前中低压配电线损耗已占整个电力线损耗的50%左右,配电网线损导致配网经济性运行面临严峻挑战,但另一方面也说明配电网在节能降损方面具有很大的潜力和空间。

    随着智能电网的信息化发展和配电网智能电表的普及应用,为配电网线损计算和分析提供了充足的数据支持,然而由于配电网线损数据的复杂性与波动性,现有一些传统的线损分析和预测方法十分依赖于配电网网架结构,不能挖掘海量数据和线损的内在规律。目前配电网线损管理分析只是对线损进行计算和简单的统计,无法从中得到影响配电线损的重要特征和未来线损的变化趋势,无法及时发现异常的线损情况并进行治理。由于大数据和人工智能技术的迅速发展,一些统计学和人工智能算法也逐步应用于配电网线损分析评估,利用这些算法的非线性拟合能力,能够较为精确的挖掘分析配电网线损的数据变化规律,精确预测未来一段时间内配电网线损的变化情况,解决传统分析预测方法计算复杂度高,依赖配电网网架结构等问题。电力企业通过对配电网线损进行分析预测,可以掌握配电网运行中影响线损变化的关键因素,辅助监测配电网异常线损现象,指导和评估配电网节能降损工作。因此,研究配电网线损规律对电力网规划运行、设备维护、效益提升方面具有重要的意义。

    随着人工智能技术的发展,国内也开始逐步重视在配电网在线损数据分析挖掘和预测方面的研究,目前国内已有较成熟的配电网负荷预测方法,线损预测方面的研究尚在起步阶段。针对线损分析方面,现有智能算法通过皮尔森相关性和灰色关联性分析方法挖掘线损相关性,皮尔森相关系数计算方便,但是只能衡量与线损线性相关的变量,灰色关联性分析通过变量和线损之间的变化态势来判断关联性,但其中的指标最优值难以确定,客观性较差。针对线损预测方面,传统方法采用简单数理统计和最小二乘回归法对配电网线损进行分析和预测,预测精度较低且无法深入挖掘线损内在规律。此外,利用支持向量机和bp神经网络等机器学习算法预测配电网线损的方法逐渐被学者提出,在一定程度上能够拟合未来线损的变化情况,但是模型未结合时间序列的前后关系特点进行预测,在预测精度方面还有待提升。



    技术实现要素:

    本申请实施例的主要目的在于提出一种配电网线损预测方法及系统,提高配电网短期线损预测的精度,以达到指导配电线损耗管理与增效运行的目的。

    为解决上述问题,第一方面,本发明实施例提供一种配电网线损预测方法,包括:

    步骤s1、提取配电网历史数据中包括若干特征的线损数据集,所述特征包括台区线损、台区负载有功功率、台区负载无功功率、在运台区数量、节假日数据、温度、湿度、风速;

    步骤s2、对线损数据集进行相关性分析,提取多个相关性最大的特征作为预测输入变量;

    步骤s3、对所述预测输入变量按特性聚类,得到多个类别线损的数据样本集;将每个类别线损的数据样本集划分为训练样本和测试样本;

    步骤s4、基于所述训练样本进行长短期记忆神经网络训练,得到用于预测配电网各类别线损的线损预测模型;

    步骤s5、基于所述测试样本对所述线损预测模型进行验证。

    作为优选的,所述步骤s1具体包括:

    步骤s11、获取配电网预测所需的线损相关的特征的历史量测数据;

    步骤s12、对每种特征的时间序列数据进行清洗,根据离群点检测方法检测剔除异常数据,采用插值改进的随机森林方法填补缺失数据,从而得到各特征完整的时间序列数据,构建各特征的时间序列样本集。

    作为优选的,所述步骤s2具体包括:

    步骤s21、从所述步骤s1得到的线损数据集中选取包含n个时刻的线损数据作为相关性分析的参考对象序列;

    步骤s22、根据与参考对象序列的时间先后关系,选取与参考对象数据相对应的前1-24小时的历史线损数据、前1-7天的历史线损数据、前1年同一时刻的历史线损数据、前2年同一时刻的历史线损数据、前1-3天的历史负载有功功率数据、前1-3小时的历史负载有功功率数据、前1-3天的历史负载无功功率数据、前1-3小时的历史负载无功功率数据、同一时刻对应的小时、星期、月份、季度、节假日和在运台区数据、同一时刻的温度、湿度和风速数据,并且选取的时间数据长度和对应的线损数据长度一致,均包含n个时刻,将选取的数据作为比较对象序列,其中每种比较对象序列对应线损的每个影响特征;

    步骤s23、采用最大互信息系数方法,计算参考对象序列与每种比较对象序列之间的最大互信息系数,分析对象序列的特征与线损相关性,选取最佳的m个特征作为配电网线损预测模型的输入特征。

    作为优选的,所述步骤s3具体包括:

    步骤s31、设置聚类数i从2到10变化,输入从步骤s10得到的p个台区线损数据样本,计算每种聚类数i下的k均值聚类误差平方和,画出聚类数与误差平方和的图像,根据图像拐点的肘部法则确定台区线损最佳聚类数k;

    步骤s32、根据步骤s31得到聚类类别数目k,设置k均值算法的初始聚类中心点,计算p个台区线损数据样本与k个初始聚类中心点的欧式距离,按照计算的距离大小将p个样本分配给最近的中心点从而形成k个簇,计算每个簇中所有对象的平均值,并将计算的k个均值作为k个簇的新聚类中心,然后不断迭代并计算聚类误差平方和,当误差平方和达到限定值时,表明算法趋于稳定,聚类中心基本不再改变,k均值聚类结束,p个台区线损数据样本被聚为k类;

    步骤s33、将步骤s32获得的每类台区线损数据样本相加,并根据s23步骤构建相应的每类台区线损的数据样本集,并对每类台区线损的数据样本集进行归一化处理;

    步骤s34、根据数据样本数量划分归一化后的每类数据样本集,其中70%的样本作为训练样本集,30%的样本作为测试样本集。

    作为优选的,所述步骤s4具体包括:

    步骤s41、根据线损聚类数搭建k个长短期记忆神经网络线损预测模型,模型的超参数包括神经网络隐层数、每层网络的神经元数量、学习率;

    步骤s42、以每类线损训练样本集作为每个神经网络预测模型的输入数据,以相应的每类线损预测样本作为输出数据,对长短期记忆神经网络预测模型进行离线训练,确定网络最优超参数,通过长短期记忆神经网络参数迭代训练,得到每类线损的线损预测模型。

    作为优选的,所述选取最佳的m个特征作为配电网线损预测模型的输入特征,具体包括:

    针对得到的各特征的最大互信息系数进行排序,依次选取最大互信息系数较大的特征,可以得到的多组选取特征,将不同组特征输入到线损预测模型进行线损预测,选择线损平均预测误差最小的一组m个特征作为配电网线损预测模型的最佳输入特征。

    作为优选的,所述计算参考对象序列与每种比较对象序列之间的最大互信息系数,具体包括:

    采用最大互信息系数方法通过联合概率计算变量与线损之间的相关性,最大互信息系数mic的计算公式如下:

    式中,x表示比较对象数据即为所分析的特征量数据,y表示参考对象数据即为线损数据,n为数据样本包含的数量,p表示概率计算,a表示表示在二维空间中x方向上划分的网格数量,b表示在二维空间中y方向上划分的网格数量,mic(x,y)表示比较对象数据x和参考数据y之间的最大相互信息系数,取值范围在0到1之间,最大互信息系数越大,x和y之间的相关性就越强,最大互信息系数越小,则x和y之间的相关性越弱。

    第二方面,本发明实施例提供了一种配电网线损预测系统,包括:

    采集模块,提取配电网历史数据中包括若干特征的线损数据集,所述特征包括台区线损、台区负载有功功率、台区负载无功功率、在运台区数量、节假日数据、温度、湿度、风速;

    变量确定模块,对线损数据集进行相关性分析,提取多个相关性最大的特征作为预测输入变量;

    样本集模块,对所述预测输入变量按特性聚类,得到多个类别线损的数据样本集;将每个类别线损的数据样本集划分为训练样本和测试样本;

    训练模块,基于所述训练样本进行长短期记忆神经网络训练,得到用于预测配电网各类别线损的线损预测模型;

    验证模块,基于所述测试样本对所述线损预测模型进行验证。

    第三方面,本发明实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明第一方面实施例所述配电网线损预测方法的步骤。

    第四方面,本发明实施例提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如本发明第一方面实施例所述配电网线损预测方法的步骤。

    本发明实施例的有益效果为:

    1、针对配电网数据进行清洗,检测剔除线损异常值,填补缺失数据,提升配电网的数据质量,为线损预测提供基础数据;

    2、选用时间跨度包含3年以上的历史实际数据,使得训练样本可以包含较长时期的线损数据,并且能适用于不同季节的线损预测;由于线损是一组具体的时间序列数据,可通过去年和前年同期历史数据与最近时刻的不同时间尺度的数据来综合挖掘未来线损变化规律;

    3、采用最大互信息系数分析方法,挖掘配电网线损与历史电气特征量和非电气特征量之间的关联关系,筛选出相关性最大的电气与非电气特征量,作为线损预测模型的输入特征量,减小线损预测模型的输入数据维度,进而提高线损预测效率和精度;

    4、采用k均值聚类方法,将配电网各台区线损数据按照曲线特性的相似程度进行聚类,将特性类似的线损数据聚为一类,深入挖掘每类线损的变化规律,分别对每类线损进行建模预测,提升线损预测的精度;

    5、基于长短期记忆神经网络建立配电网线损预测模型,训练模型适用于时间序列数据,可以通过其神经元门的结构传递时间序列中有效信息,通过模型自学习能力可以充分挖掘配电网线损的数据规律,预测精度高且不容易过拟合。

    附图说明

    一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。

    图1根据本发明实施例的一种配电网线损预测方法流程图;

    图2为根据本发明实施例的随机森林配电网数据填补矩阵图;

    图3(a)为根据本发明实施例的历史网损特征的最大互信息系数计算结果图;

    图3(b)为根据本发明实施例的历史负载功率特征的最大互信息系数计算结果图;

    图3(c)为根据本发明实施例的时间特征的最大互信息系数计算结果图;

    图3(d)为根据本发明实施例的气象特征的最大互信息系数计算结果图;

    图4为根据本发明实施例的聚类肘部曲线图;

    图5为根据本发明实施例的长短期记忆神经网络神经元的结构示意;

    图6为根据本发明实施例的每类网损预测结果图;

    图7为根据本发明实施例的不同模型的线损预测结果对比图;

    图8为根据本发明又一种实施例的一种服务器示意图。

    具体实施方式

    为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请的各实施例进行详细的阐述。然而,本领域的普通技术人员可以理解,在本申请各实施例中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施例的种种变化和修改,也可以实现本申请所要求保护的技术方案。以下各个实施例的划分是为了描述方便,不应对本申请的具体实现方式构成任何限定,各个实施例在不矛盾的前提下可以相互结合相互引用。

    本申请实施例中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。

    本申请实施例中的术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。本申请的描述中,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列部件或单元的系统、产品或设备没有限定于已列出的部件或单元,而是可选地还包括没有列出的部件或单元,或可选地还包括对于这些产品或设备固有的其它部件或单元。本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

    在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。

    针对线损预测方面,传统方法采用简单数理统计和最小二乘回归法对配电网线损进行分析和预测,预测精度低且无法深入挖掘线损内在规律。利用支持向量机和bp神经网络等机器学习算法预测配电网线损的方法被学者提出,在一定程度上能够拟合未来线损的变化情况,但是模型未结合时间序列的前后关系进行预测,在预测精度方面还有待提升。

    因此,本发明实施例提供一种配电网线损预测方法及系统,采用最大互信息系数分析方法,挖掘配电网线损与历史电气特征量和非电气特征量之间的关联关系,筛选出相关性最大的电气与非电气特征量,作为线损预测模型的输入特征量,减小线损预测模型的输入数据维度,进而提高线损预测效率和精度,采用k均值聚类方法,将配电网各台区线损数据按照曲线特性的相似程度进行聚类,将特性类似的线损数据聚为一类,深入挖掘每类线损的变化规律,分别对每类线损进行建模预测,提升线损预测的精度。以下将通过多个实施例进行展开说明和介绍。

    图1为根据本发明实施例提供的一种配电网线损预测方法,包括:

    步骤s1、提取配电网历史数据中包括若干特征的线损数据集,所述特征包括台区线损、台区负载有功功率、台区负载无功功率、在运台区数量、节假日数据、温度、湿度、风速;

    步骤s11、获取配电网预测所需的线损相关的特征的历史量测数据;

    具体地,考虑到不同季节的短期和同期数据对线损的影响情况,本实施例选用时间跨度为包含3年半较长时期的实际配电网历史运行数据来进行线损预测,此外还选用了非电气量数据,可以增强线损预测模型在不同环境与不同时期下的适用性。

    步骤s12、对每种特征的时间序列数据进行清洗,根据离群点检测方法检测剔除异常数据,采用插值改进的随机森林方法填补缺失数据,从而得到各特征完整的时间序列数据,构建各特征的时间序列样本集。

    具体地,考虑到原始配电网数据具有一些异常值和缺失值现象,本实施例通过采用离群点检测方法首先对配电网数据异常值进行检测,通过数据点的局部异常因子计算来检测配电网异常数据,局部异常因子计算公式如下:

    其中,lof为局部异常因子,ρk表示数据点的局部可达密度,表示领域内所有点到o的平均可达距离,k为o点的第k领域,nk(o)表示o的邻域点集合。lof值可以衡量点之间距离越远,密度越低,距离越近,密度越高,lof值越大,密度越低越可能为异常数据。

    采用插值改进的随机森林算法对配电网缺失数据进行填补,具体过程如下:

    首先,统计配电网数据矩阵x的缺失情况,遍历每日数据,从缺失最少的日数据开始进行填补,在填补前先将其他缺失数据用线性插值进行处理,得到矩阵xnew。

    然后,用训练集xtrain训练随机森林填补模型,训练标签为不含缺失部分的数据ytrain组成,填补模型训练完成后,对验证集xtest进行验证,从而填补缺失数据ytest。每完成一次随机森林填补,用填补后的数据更新配电网数据矩阵,再继续循环算法,填补下一个含缺失值的日数据。每次填补完毕,含缺失值的日数据也相应减少,所以需要用插值来处理的数据也越少。当进行到最后一个日数据时,其它的日数据已经不需要用线性插值进行处理,并且随机森立已经填补大量有效的信息,可以用来填补缺失最多的日数据。

    最后,遍历完所有数据后,配电网数据矩阵不再含缺失值,数据填补完成。其中,随机森林配电网数据填补矩阵如图2所示。

    通过数据清洗,解决配网数据因为测量设备出现故障、“噪音”干扰、数据传输错误或用电异常所导致的采集值异常和缺失现象,为配电网线损预测模型提供高质量的基础数据。

    步骤s2、对线损数据集进行相关性分析,提取多个相关性最大的特征作为预测输入变量;

    步骤s21、从所述步骤s1得到的线损数据集中选取包含n个时刻的线损数据作为相关性分析的参考对象序列;

    步骤s22、根据与参考对象序列的时间先后关系,选取与参考对象数据相对应的前1-24小时的历史线损数据、前1-7天的历史线损数据、前1年同一时刻的历史线损数据、前2年同一时刻的历史线损数据、前1-3天的历史负载有功功率数据、前1-3小时的历史负载有功功率数据、前1-3天的历史负载无功功率数据、前1-3小时的历史负载无功功率数据、同一时刻对应的小时、星期、月份、季度、节假日和在运台区数据、同一时刻的温度、湿度和风速数据,并且选取的时间数据长度和对应的线损数据长度一致,均包含n个时刻,将选取的数据作为比较对象序列,其中每种比较对象序列对应线损的每个影响特征;

    其中,线损、负载有功功率、负载无功功率、温度、湿度和风速数据为智能采集设备采集到的数据,数据形式为15分钟一个数据点,一天共包含96个数据点,小时,星期、月份、季度、节假日数据分别对应于智能采集设备获得数据的时间信息。

    步骤s23、采用最大互信息系数方法,计算参考对象序列与每种比较对象序列之间的最大互信息系数,分析对象序列的特征与线损相关性,选取最佳的m个特征作为配电网线损预测模型的输入特征。

    其中,采用最大互信息系数方法通过联合概率计算变量与线损之间的相关性,最大互信息系数mic的计算公式如下:

    式中,x表示比较对象数据即为所分析的特征量数据,y表示参考对象数据即为线损数据,n为数据样本包含的数量,p表示概率计算,a表示表示在二维空间中x方向上划分的网格数量,b表示在二维空间中y方向上划分的网格数量,mic(x,y)表示比较对象数据x和参考数据y之间的最大相互信息系数,取值范围在0到1之间,最大互信息系数越大,x和y之间的相关性就越强,最大互信息系数越小,则x和y之间的相关性越弱。

    其中,m个配电网线损预测模型的最佳输入特征的选取方法为:针对得到的各特征的最大互信息系数进行排序,依次选取最大互信息系数较大的特征,可以得到的多组选取特征,将不同组特征输入到线损预测模型进行线损预测,选择线损平均预测误差最小的一组m个特征作为配电网线损预测模型的最佳输入特征。

    步骤s3、对所述预测输入变量按特性聚类,得到多个类别线损的数据样本集;将每个类别线损的数据样本集划分为训练样本和测试样本;

    步骤s31、设置聚类数i从2到10变化,输入从步骤s10得到的p个台区线损数据样本,计算每种聚类数i下的k均值聚类误差平方和,画出聚类数与误差平方和的图像,根据图像拐点的肘部法则确定台区线损最佳聚类数k;

    其中,肘部法则的原理是:在聚类数k不断增大的过程中,样本数据被划分的更加精细,每个簇的聚合程度逐渐提高,因此误差平方和逐步减小。当聚类数k小于最佳聚类数时,k增大会增加每个簇的聚合程度,误差平方和sse的下降幅度大。当聚类数k达到最佳聚类数时,再增加聚类数k时对误差平方和sse的下降幅度趋于平缓,因此曲线呈现肘部形状。一般取肘部位置对应的k值作为最佳聚类数,此聚类数下,误差下降最快。k均值聚类误差平方和计算公式如下所示:

    式中,k为聚类数,mi为第ci类样本的聚类中心,xa是属于ci类中的样本。

    步骤s32、根据步骤s31得到聚类类别数目k,设置k均值算法的初始聚类中心点,计算p个台区线损数据样本与k个初始聚类中心点的欧式距离,按照计算的距离大小将p个样本分配给最近的中心点从而形成k个簇,计算每个簇中所有对象的平均值,并将计算的k个均值作为k个簇的新聚类中心,然后不断迭代并计算聚类误差平方和,当误差平方和达到限定值时,表明算法趋于稳定,聚类中心基本不再改变,k均值聚类结束,p个台区线损数据样本被聚为k类;

    步骤s33、将步骤s32获得的每类台区线损数据样本相加,并根据s23步骤构建相应的每类台区线损的数据样本集,并对每类台区线损的数据样本集进行归一化处理;

    其中,数据样本集归一化公式具体如下:

    式中,x为需要处理的特征样本,xmax和xmin分别为该特征样本的最大值和最小值,x’为归一化后的数值。

    步骤s34、根据数据样本数量划分归一化后的每类数据样本集,其中70%的样本作为训练样本集,30%的样本作为测试样本集。

    步骤s4、基于所述训练样本进行长短期记忆神经网络训练,得到用于预测配电网各类别线损的线损预测模型;

    离线训练模型具体步骤如下:

    输入门中输入上一时刻状态,上一隐藏层状态单元和当前状态。输入门的输入经过非线性函数的变换后,通过遗忘门进行状态信息筛选,使lstm神经网络清除上一步对当前没有用的状态信息,根据输入门输入的三种变量共同决定哪一部分的状态信息需要被神经网络遗忘,同时决定有用信息进入新的当前状态。最后,输出门利用新的当前状态,进行运算确定有多少信息输出到当前隐藏层状态单元,当前隐藏层状态单元会进入下一个lstm神经元进行计算,因此建立了前后时间序列之间的联系。其中,各变量之间的具体计算公式如下:

    i(t)=σ(wih(t-1) uix(t) bi)

    a(t)=tanh(wah(t-1) uax(t) ba)

    f(t)=σ(wfh(t-1) ufx(t) bf)

    c(t)=i(t)ea(t) ftec(t-1)

    o(t)=σ(uox(t) woh(t-1) bo)

    h(t)=o(t)gtanh(c(t))

    其中,输入门输出包括两部分i(t)和a(t),wi,wa为上一时刻隐藏层状态的连接权重,ui,ua为输入门的连接权重,bi,ba分别为各自的输入门偏置。遗忘门的输出是f(t),wf,uf,bf分别为遗忘门的循环权重、输入权重和遗忘门偏置。新的当前状态c(t)分别是由输入门,遗忘门的输出和上一时刻状态c(t-1)共同决定的,输出门输出结果为o(t),u0,w0,b0分别为输出门权重、循环权重和输出门偏置。隐藏层状态h(t)由输出门输出和当前状态共同决定,此外公式中的σ为激活函数,可以为tanh或sigmoid函数。

    为了比较配电网网损预测模型的预测效果,预测结果评估指标参考预测模型常用指标,采用平均绝对百分误差(meanabsolutepercentageerror,mape)与均方根误差(rootmeansquarederror,rmse)两种指标衡量预测值与实际值之间的偏差。具体误差公式如下式所示:

    其中,n为样本数量,yi’表示模型的预测值,yi表示实际值。为了反映本预测模型在网损预测精度方面的优势,加入了一些在预测领域获得广泛应用的机器学习预测方法与本文方法进行误差对比。

    此外,采用计算平均绝对误差的标准差σmape来说明预测误差的波动程度,检验预测模型的鲁棒性。计算如公式如下所示。

    其中,n为样本数量,mi为第i个预测样本的平均绝对误差,为n个样本的平局绝对误差的平均值。

    步骤s41、根据线损聚类数搭建k个长短期记忆神经网络线损预测模型,模型的超参数包括神经网络隐层数、每层网络的神经元数量、学习率;

    拟定长短期记忆神经网络的隐层数量、每层网络的神经元数量和学习率的取值范围,通过循环设定不同的超参数值进行线损预测,选择线损平均预测误差最小的超参数值作为配电网线损预测模型的最优超参数。

    步骤s42、以每类线损训练样本集作为每个神经网络预测模型的输入数据,以相应的每类线损预测样本作为输出数据,对长短期记忆神经网络预测模型进行离线训练,确定网络最优超参数,通过长短期记忆神经网络参数迭代训练,最终得到每类线损的预测模型。长短期记忆神经网络预测模型迭代训练的参数包括:输入门的权重和偏置、遗忘门的权重和偏置、输出门的权重和偏置。

    其中,确定长短期记忆神经网络最优超参数方法如下:拟定长短期记忆神经网络的隐层数量、每层网络的神经元数量和学习率的取值范围,通过循环设定不同的超参数值进行线损预测,选择线损平均预测误差最小的超参数值作为配电网线损预测模型的最优超参数。

    步骤s5、基于所述测试样本对所述线损预测模型进行验证。

    本实施例中,以输入测试样本对未来1天的线损进行预测。

    步骤s51、获取步骤s33获得的线损测试样本集,输入步骤s42得到的每类神经网络线损预测模型,得到每类线损的归一化预测值;

    步骤s52、将每类线损的归一化预测值进行反归一化处理,得到每类线损的预测线损值;

    其中,反归一化的具体公式如下:

    式中,xmax和xmin分别为每类线损归一化变量的最大值和最小值,x’为线损预测值。

    步骤s53、从步骤s52获取每类线损的预测值,进行求和得到线路总线损预测值。

    以下提供具体实施例对本发明技术方案作进一步实施解释说明:

    根据某地区10kv实际的配电网模型数据,包含1个110kv变10kv的主变电站,共有46个台区,68条架空线路。对该配电网线损进行提前一天(96个数据点)的预测,预测具体流程如图1所示。

    s201、分析选择影响配电网线损特征,本发明实施例对配电网中某线路的线损进行最大互信息系数计算分析,特征编号如表1所示,最大互信息系数计算结果如图3所示。

    表1

    其中,最大互信息系数方法表明部分历史线损,历史负载有功功率数据对线损具有强相关性。此外小时,季度,节假日,在运台区数量和温度特征也与线损具有较强的关联性。因此,通过对配电网线损影响特征进行分析,通过最佳输入特征的选取方法选择历史网损(前1小时网损,前1-7天同一时刻的历史网损,前一年和前两年同一时刻的历史网损),历史负载有功功率特征(前1到3天的历史负载有功功率),以及小时,季度,节假日,在运台区数量和温度特征作为配电网网损预测的输入特征,对应线损预测平均误差值最小。

    s301、本发明实施例对配电网某线路中46个台区,68条架空线路的线损数据进行聚类,令聚类数i从2到10变化,得到图4为本发明实施例中在聚类数变化下的聚类误差平方和曲线图,根据肘部法则,最佳聚类数应选取肘部位置为4,线损被聚为4类;

    s302、本发明实施案例采用配电网某线路长时期数据1308天的数据,将其分为两部分,其中916天为训练样本集,392天为验证样本集。

    s401、本发明实施案例采用python代码编写,基于谷歌学习框架tensorflow搭建lstm神经网络,设置lstm层的激活函数为tanh(),损失函数设为均方误差mse,batch_size取672,长短期记忆神经网络的神经元结构图如图5所示。

    s402、本发明实施案例构建了4类线损预测的长短期记忆神经网络模型,通过模型训练得到的最优超参数结果如表2所示。

    表2

    s50、通过在线应用训练好的长短期记忆神经网络对每类线损进行预测,其中三天预测结果如图6所示,并且将四类线损预测结果相加作为总线损预测结果,为了对比本文方法在预测精度和鲁棒性方面的提升,本文基于各模型的预测能力,选择预测性能较好的支持向量机(supportvectormachine,svm)随机森林(randomforest,rf),反向传播(backpropagation,bp)神经网络算法对线损进行预测,还同时设置了未进行聚类的长短期记忆神经网络对线损进行预测,预测结果如图6所示,预测误差如表3所示。通过结果对比分析,可以得到本发明所提线损预测方法的误差最小,误差波动也较为稳定,预测模型的精确性和鲁棒性最佳。

    表3

    本发明实施例提供的基于k均值聚类和长短期记忆神经网络的线损预测方法可以提高配电网短期线损预测的精度,以达到指导配电线损耗管理与增效运行的目的,为电网降损节能提供决策依据。

    本发明实施例还提供了一种配电网线损预测系统,基于上述各实施例中的配电网线损预测方法,包括:

    采集模块,提取配电网历史数据中包括若干特征的线损数据集,所述特征包括台区线损、台区负载有功功率、台区负载无功功率、在运台区数量、节假日数据、温度、湿度、风速;

    变量确定模块,对线损数据集进行相关性分析,提取多个相关性最大的特征作为预测输入变量;

    样本集模块,对所述预测输入变量按特性聚类,得到多个类别线损的数据样本集;将每个类别线损的数据样本集划分为训练样本和测试样本;

    训练模块,基于所述训练样本进行长短期记忆神经网络训练,得到用于预测配电网各类别线损的线损预测模型;

    验证模块,基于所述测试样本对所述线损预测模型进行验证。

    基于相同的构思,本发明实施例还提供了一种服务器示意图,如图8所示,该服务器可以包括:处理器(processor)810、通信接口(communicationsinterface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行如上述各实施例所述配电网线损预测方法的步骤。例如包括:

    步骤s1、提取配电网历史数据中包括若干特征的线损数据集,所述特征包括台区线损、台区负载有功功率、台区负载无功功率、在运台区数量、节假日数据、温度、湿度、风速;

    步骤s2、对线损数据集进行相关性分析,提取多个相关性最大的特征作为预测输入变量;

    步骤s3、对所述预测输入变量按特性聚类,得到多个类别线损的数据样本集;将每个类别线损的数据样本集划分为训练样本和测试样本;

    步骤s4、基于所述训练样本进行长短期记忆神经网络训练,得到用于预测配电网各类别线损的线损预测模型;

    步骤s5、基于所述测试样本对所述线损预测模型进行验证。

    此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

    基于相同的构思,本发明实施例还提供一种非暂态计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序包含至少一段代码,该至少一段代码可由主控设备执行,以控制主控设备用以实现如上述各实施例所述配电网线损预测方法的步骤。例如包括:

    步骤s1、提取配电网历史数据中包括若干特征的线损数据集,所述特征包括台区线损、台区负载有功功率、台区负载无功功率、在运台区数量、节假日数据、温度、湿度、风速;

    步骤s2、对线损数据集进行相关性分析,提取多个相关性最大的特征作为预测输入变量;

    步骤s3、对所述预测输入变量按特性聚类,得到多个类别线损的数据样本集;将每个类别线损的数据样本集划分为训练样本和测试样本;

    步骤s4、基于所述训练样本进行长短期记忆神经网络训练,得到用于预测配电网各类别线损的线损预测模型;

    步骤s5、基于所述测试样本对所述线损预测模型进行验证。

    基于相同的技术构思,本申请实施例还提供一种计算机程序,当该计算机程序被主控设备执行时,用以实现上述方法实施例。

    所述程序可以全部或者部分存储在与处理器封装在一起的存储介质上,也可以部分或者全部存储在不与处理器封装在一起的存储器上。

    基于相同的技术构思,本申请实施例还提供一种处理器,该处理器用以实现上述方法实施例。上述处理器可以为芯片。

    本发明的各实施方式可以任意进行组合,以实现不同的技术效果。

    在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solidstatedisk)等。

    最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。


    技术特征:

    1.一种配电网线损预测方法,其特征在于,包括:

    步骤s1、提取配电网历史数据中包括若干特征的线损数据集,所述特征包括台区线损、台区负载有功功率、台区负载无功功率、在运台区数量、节假日数据、温度、湿度、风速;

    步骤s2、对线损数据集进行相关性分析,提取多个相关性最大的特征作为预测输入变量;

    步骤s3、对所述预测输入变量按特性聚类,得到多个类别线损的数据样本集;将每个类别线损的数据样本集划分为训练样本和测试样本;

    步骤s4、基于所述训练样本进行长短期记忆神经网络训练,得到用于预测配电网各类别线损的线损预测模型;

    步骤s5、基于所述测试样本对所述线损预测模型进行验证。

    2.根据权利要求1所述的配电网线损预测方法,其特征在于,所述步骤s1具体包括:

    步骤s11、获取配电网预测所需的线损相关的特征的历史量测数据;

    步骤s12、对每种特征的时间序列数据进行清洗,根据离群点检测方法检测剔除异常数据,采用插值改进的随机森林方法填补缺失数据,从而得到各特征完整的时间序列数据,构建各特征的时间序列样本集。

    3.根据权利要求1所述的配电网线损预测方法,其特征在于,所述步骤s2具体包括:

    步骤s21、从所述步骤s1得到的线损数据集中选取包含n个时刻的线损数据作为相关性分析的参考对象序列;

    步骤s22、根据与参考对象序列的时间先后关系,选取与参考对象数据相对应的前1-24小时的历史线损数据、前1-7天的历史线损数据、前1年同一时刻的历史线损数据、前2年同一时刻的历史线损数据、前1-3天的历史负载有功功率数据、前1-3小时的历史负载有功功率数据、前1-3天的历史负载无功功率数据、前1-3小时的历史负载无功功率数据、同一时刻对应的小时、星期、月份、季度、节假日和在运台区数据、同一时刻的温度、湿度和风速数据,并且选取的时间数据长度和对应的线损数据长度一致,均包含n个时刻,将选取的数据作为比较对象序列,其中每种比较对象序列对应线损的每个影响特征;

    步骤s23、采用最大互信息系数方法,计算参考对象序列与每种比较对象序列之间的最大互信息系数,分析对象序列的特征与线损相关性,选取最佳的m个特征作为配电网线损预测模型的输入特征。

    4.根据权利要求1所述的配电网线损预测方法,其特征在于,所述步骤s3具体包括:

    步骤s31、设置聚类数i从2到10变化,输入从步骤s10得到的p个台区线损数据样本,计算每种聚类数i下的k均值聚类误差平方和,画出聚类数与误差平方和的图像,根据图像拐点的肘部法则确定台区线损最佳聚类数k;

    步骤s32、根据步骤s31得到聚类类别数目k,设置k均值算法的初始聚类中心点,计算p个台区线损数据样本与k个初始聚类中心点的欧式距离,按照计算的距离大小将p个样本分配给最近的中心点从而形成k个簇,计算每个簇中所有对象的平均值,并将计算的k个均值作为k个簇的新聚类中心,然后不断迭代并计算聚类误差平方和,当误差平方和达到限定值时,表明算法趋于稳定,聚类中心基本不再改变,k均值聚类结束,p个台区线损数据样本被聚为k类;

    步骤s33、将步骤s32获得的每类台区线损数据样本相加,并根据s23步骤构建相应的每类台区线损的数据样本集,并对每类台区线损的数据样本集进行归一化处理;

    步骤s34、根据数据样本数量划分归一化后的每类数据样本集,其中70%的样本作为训练样本集,30%的样本作为测试样本集。

    5.根据权利要求4所述的配电网线损预测方法,其特征在于,所述步骤s4具体包括:

    步骤s41、根据线损聚类数搭建k个长短期记忆神经网络线损预测模型,模型的超参数包括神经网络隐层数、每层网络的神经元数量、学习率;

    步骤s42、以每类线损训练样本集作为每个神经网络预测模型的输入数据,以相应的每类线损预测样本作为输出数据,对长短期记忆神经网络预测模型进行离线训练,确定网络最优超参数,通过长短期记忆神经网络参数迭代训练,得到每类线损的线损预测模型。

    6.根据权利要求3所述的配电网线损预测方法,其特征在于,所述选取最佳的m个特征作为配电网线损预测模型的输入特征,具体包括:

    针对得到的各特征的最大互信息系数进行排序,依次选取最大互信息系数较大的特征,可以得到的多组选取特征,将不同组特征输入到线损预测模型进行线损预测,选择线损平均预测误差最小的一组m个特征作为配电网线损预测模型的最佳输入特征。

    7.根据权利要求1所述的配电网线损预测方法,其特征在于,所述计算参考对象序列与每种比较对象序列之间的最大互信息系数,具体包括:

    采用最大互信息系数方法通过联合概率计算变量与线损之间的相关性,最大互信息系数mic的计算公式如下:

    式中,x表示比较对象数据即为所分析的特征量数据,y表示参考对象数据即为线损数据,n为数据样本包含的数量,p表示概率计算,a表示表示在二维空间中x方向上划分的网格数量,b表示在二维空间中y方向上划分的网格数量,mic(x,y)表示比较对象数据x和参考数据y之间的最大相互信息系数,取值范围在0到1之间,最大互信息系数越大,x和y之间的相关性就越强,最大互信息系数越小,则x和y之间的相关性越弱。

    8.一种配电网线损预测系统,其特征在于,包括:

    采集模块,提取配电网历史数据中包括若干特征的线损数据集,所述特征包括台区线损、台区负载有功功率、台区负载无功功率、在运台区数量、节假日数据、温度、湿度、风速;

    变量确定模块,对线损数据集进行相关性分析,提取多个相关性最大的特征作为预测输入变量;

    样本集模块,对所述预测输入变量按特性聚类,得到多个类别线损的数据样本集;将每个类别线损的数据样本集划分为训练样本和测试样本;

    训练模块,基于所述训练样本进行长短期记忆神经网络训练,得到用于预测配电网各类别线损的线损预测模型;

    验证模块,基于所述测试样本对所述线损预测模型进行验证。

    9.一种服务器,其特征在于,包括:

    至少一个处理器;以及,

    与所述至少一个处理器通信连接的存储器;其中,

    所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7任一项所述配电网线损预测方法的步骤。

    10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述配电网线损预测方法的步骤。

    技术总结
    本发明实施例提供一种配电网线损预测方法及系统,获取并清洗配电网中各线路,各台区的时间序列数据,采用离群点检测方法,检测剔除时间序列的异常数据,并建立插值改进的随机森林模型,填补时间序列缺失数据。根据各时间序列特征的变化规律,计算各特征与线损数据的最大互信息系数,从中选取与线损相关性最大的特征作为线损预测模型的输入特征;根据各台区线损的时间序列数据,采用k均值聚类方法将特性类似的线损数据进行聚类,并且划分每类线损数据集,建立长短期记忆神经网络预测模型,输入训练样本训练长短期记忆神经网络,得到线损预测模型;可以提高配电网短期线损预测的精度,以达到指导配电线损耗管理与增效运行的目的。

    技术研发人员:李勇;郭钇秀;乔学博;周王峰;段义隆
    受保护的技术使用者:湖南大学
    技术研发日:2020.12.01
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-18361.html

    最新回复(0)