本发明涉及电力工程中的负荷辨识技术,具体涉及一种基于特征自学习的高精度负荷辨识方法及系统。
背景技术:
随着工业向电气化和智能化的快速发展,工业企业使用的智能电气设备的增多,一方面对供电可靠性和电能质量的需求也越来越高,另一方面也对供电公司的服务水平有了更多的要求。供电公司为了能够更快速地响应用户的需求,就需要对用户的用电情况和用能习惯有一个全面和深入的了解,并且不能干扰用户的日常生产,同时尽量降低获取成本。当前,非介入式负荷辨识算法能够满足上述的所有需求。该方法将负荷辨识终端安装在用户的电源总出线侧,能够在不安装其他测量设备的情况下,通过单个电源点的电气特征对用户的大型负荷进行启停识别、功率计算和电能计量等多种电气参数进行计算,满足供电公司对用户详细用电数据的收集要求,为后续的用户服务提供有效的基础支撑。
当前,有许多机构提出了不同的非介入式负荷辨识算法。例如申请号为201710177080.1的中国专利文献公开了一种基于多特征融合的电力负荷辨识方法,该方法在用户的用电入口处对有功功率进行监测,通过整数规划求解,提取统计特征和奇异值特征,计算负荷特征相似度的方式,得到综合相似度最大值的值即为辨识设备。申请号为201811489020.4的中国专利文献公开了中国电力科学研究院有限公司发明的一种非侵入式用电负荷辨识方法及装置,采集负荷供电入口处的第一电流信号,并利用预先定义的负荷对应的匹配滤波器对所述第一电流信号进行辨识。申请号为201910267587.5的中国专利文献公开了一种基于数据挖掘技术的非侵入式负荷辨识方法以及装置(专利201910267587.5),以cart树为弱分类器建立随机森林模型,并保留各cart树的划分属性及其属性值来形成模型参数库,然后根据模型参数库进行负荷辨识,得到该段时间内负荷比例构成情况。申请号为202010207857.6的中国专利文献公开了一种非入侵式负荷辨识方法及装置,根据获取到的电力供给入口处的时间序列找出时间序列的暂态阶段,提取暂态阶段的负荷辨识特征量,并根据负荷辨识特征量和预置负荷库确定负荷类型。
综上所述,现有负荷辨识算法相关的发明存在以下几个不足之处:
1、现有的负荷辨识算法对象多为家用电器,这些家用电气的负荷特征及数量与工矿企业的负荷特征及设备数量完全不同,因此这些算法很难工业用户上应用;
2、基于居民用户的应用场景,现有的负荷辨识算法都是基于低成本的硬件系统进行设计的,因此数据采集密度和类型都非常有限,其负荷辨识精度无法满足工业用户的需求;
3、现有的负荷辨识算法能够使用的前提,都是已经拥有了被良好标签的训练数据集,或具有专家知识的监督能力,这两个条件往往很难在工业用户的场景中实现,因为负荷种类太多,需要识别的内容也太多很难归类。
技术实现要素:
本发明要解决的技术问题:针对现有技术的上述问题,提供一种基于特征自学习的高精度负荷辨识方法及系统,本发明能够对高密度多维度的采样数据进行处理,通过波形提取,利用最小冗余和最大相关性选择最优特征集,并利用部分结构隐藏支持向量机对动态负荷特征模型进行自动学习,并利用训练模型进行负荷辨识。
为了解决上述技术问题,本发明采用的技术方案为:
一种基于特征自学习的高精度负荷辨识方法,包括:
1)采集高密度和多维度的电气数据;
2)按照波形抽取方法进行波形切片操作,对波形切进行预筛选,被选中的波形切会被放入波形汇集池中;
3)使用最小冗余和最大相关性方法为预筛选后的波形切片选择出最优特征集;
4)利用波形切片的最优特征集对对波形切片建立动态负荷特征模型,将动态负荷特征模型加入特征模型数据库;所述动态负荷特征模型为一个数据集,其格式可以表示为{xi,yi,zi},其中,i为波形序号,xi是对应的最优特征集,yi是波形状态标记,分为有效波形和无效波形两类,zi为波形的类别编号,用于标识其对应的负荷编号;所述特征模型数据库中的模型按照最优特征集的多维空间位置进行定位,使用k均值聚类的方式进行类型划分,每次加入新的动态负荷特征模型时,波形状态标记都为“无效波形”,其对应负荷编号为0;
5)利用部分结构隐藏支持向量机算法对分类器模型进行更新,所述分类器模型为一个组合分类器g,它由多个基分类器组成;当新的动态负荷特征模型加入特征模型数据库时,利用分类器模型对新的动态负荷特征模型进行部分结构隐藏支持向量机分类,如果能够被划分入已有分类,则将该新的动态负荷特征模型标识为该分类,输出负荷种类信息;如果新的动态负荷特征模型无法被分入已有类型,则标记为“无效波形”,并将新的动态负荷特征模型存入特征模型数据库。
可选地,步骤1)中采集高密度和多维度的电气数据具体是指超过预设频率阈值的采样频率进行采样得到c维的数据得到高密度和多维度的波形向量{x1,…,xt},其中元素x1~xt都是一个c维的向量,其中c为采样通道的数量,t表示采样采样数据总数。
可选地,步骤2)包括:
2.1)针对波形向量{x1,…,xt},使用滑窗的方式对波形向量进行扫描,滑窗的窗口长度为l,对于任意通道i,在时间t时窗口中获得的数据集表示为:
上式中,
2.2)针对任意时窗口中获得的数据集,分别计算其平均值、方差值、最大值、最小值、中间值和熵,并进行下述处理:(1)针对任意采样通道i在t时刻的原始采样数据
2.3)将本窗口的特征向量、下一个窗口的特征向量之间的进行距离计算,若计算得到的距离超过预设阈值dmax,则将该窗口的数据及对应特征向量作为波形切片放入波形汇集池,从而在波形汇集池中得到预筛选后的波形切片。
可选地,步骤3)中使用最小冗余和最大相关性方法为预筛选后的波形切片选择出最优特征集包括:
3.1)根据下式针对预筛选后的波形切片执行最大相关性的特征搜索;
上式中,式中,s为所有特征的集合,c为某一个特征类,i(xi;c)为特征集中第i类特征与特征类c的互信息,d(s,c)表示在集合s中搜索到的与c具有最大相关性结果的集合,maxd(s,c)表示该集合中的数据按照从大至小的方式进行排列,d表示最大相关性特征搜索的对应公式。
3.2)根据下式针对执行最大相关性的特征搜索的结果执行最小冗余的特征搜索;
上式中,r(s)表示在集合s中搜索到的任意两个元素的相关性结果的集合,minr(s)表示该集合中的数据按照从小至大的方式进行排列,r表示最小冗余搜索的对应公式,i(xi;xj)为特征集中第i类特征与第j类特征的互信息;
3.3)根据下式将执行最大相关性的特征搜索、执行最小冗余的特征搜索进行综合;
maxφ(d,r),φ=d-r
上式中,φ(d,r)表示对应数据集d和r计算得到的mrmr结果集合,maxφ(d,r)表示该集合中的数据按照从大至小的方式进行排列,φ表示mrmr的对应计算公式;
3.4)将综合求出的最优解作为经过mrmr计算得到的最大特征子集sm-1的特征子集,并在x-sm-1中使用以下公式继续择出m个特征作为最优特征集,其中表示总特征集合去掉sm-1特征子集后的剩余特征集合,m表示指定特征的个数;
上式中,i(xj;c)为特征集中第j类特征xj与c的互信息,m表示选出的最优特征集数量,i(xi;xj)为特征集中第i类特征xi与xj的互信息,sm-1表示经过mrmr计算得到的最大特征子集。
可选地,步骤5)中组合分类器g的函数表达式为:
其中,g(w,x)表示组合分类器g,w为训练参数矩阵,x为切片波形的最优特征集,f1(w,x)~fk(w,x)分别为第1~k个基分类器,k为所有已被标记过的负荷类别数量。
可选地,步骤5)中组合分类器g的使用了特征映射:
其中,φ表示特征映射集,
其中,基分类器的函数表达式为:
φ(x)表示基分类器的输入,b为偏置;
组合分类器g铰链损失函数为:
[1-yimink{w·φk(xi)}]
其中,φk(xi)表示对xi进行多维希尔伯特空间变换,yi表示xi对应动态负荷特征模型的第二维变量。
可选地,步骤5)之后还包括定时根据特征模型数据库对特征模型数据库进行更新的步骤,包括:(1)对已经分类的特征集进行再次训练,得到新的部分结构隐藏支持向量机算法参数;(2)将标记为“无效波形”的模型进行多维k均值聚类,如果某个模型分类数量超过预设的阈值nlim则将其标识为新的分类,实现负荷种类的自动更新,其中新分类对应的实际负荷类型通过人工指定的方式确定。
此外,本发明还提供一种基于特征自学习的高精度负荷辨识系统,包括相互连接的微处理器和存储器,所述微处理器被编程或配置以执行前述基于特征自学习的高精度负荷辨识方法的步骤,或者所述存储器中存储有被编程或配置以执行前述基于特征自学习的高精度负荷辨识方法的计算机程序。
此外,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有被编程或配置以执行前述基于特征自学习的高精度负荷辨识方法的计算机程序。
此外,本发明还提供一种基于特征自学习的高精度负荷辨识系统,包括:
数据采集程序单元,用于采集高密度和多维度的电气数据;
特殊波形提取程序单元,用于按照波形抽取方法进行波形切片操作,对波形切进行预筛选,被选中的波形切会被放入波形汇集池中;
最优特征集选择程序单元,用于使用最小冗余和最大相关性方法为预筛选后的波形切片选择出最优特征集;
动态负荷特征分析程序单元,用于利用波形切片的最优特征集对对波形切片建立动态负荷特征模型,将动态负荷特征模型加入特征模型数据库;所述动态负荷特征模型为一个数据集,其格式可以表示为{xi,yi,zi},其中,i为波形序号,xi是对应的最优特征集,yi是波形状态标记,分为有效波形和无效波形两类,zi为波形的类别编号,用于标识其对应的负荷编号;所述特征模型数据库中的模型按照最优特征集的多维空间位置进行定位,使用k均值聚类的方式进行类型划分,每次加入新的动态负荷特征模型时,波形状态标记都为“无效波形”,其对应负荷编号为0;
分类识别程序单元,用于利用部分结构隐藏支持向量机算法对分类器模型进行更新,所述分类器模型为一个组合分类器g,它由多个基分类器组成;当新的动态负荷特征模型加入特征模型数据库时,利用分类器模型对新的动态负荷特征模型进行部分结构隐藏支持向量机分类,如果能够被划分入已有分类,则将该新的动态负荷特征模型标识为该分类,输出负荷种类信息;如果新的动态负荷特征模型无法被分入已有类型,则标记为“无效波形”,并将新的动态负荷特征模型存入特征模型数据库。
和现有技术相比,本发明具有下述优点:本发明包括利用高密度多维度数据的特点,使用多类不同数据集的多种统计量来进行波形切片和特征提取,使用最小冗余和最大相关性方法为每个波形切片选择最合适的特征,利用部分结构隐藏支持向量机算法对现有模型进行自学习。本发明能够对高密度多维度数据进行处理和分析,不会漏掉任何负荷特征的细节变化。最小冗余和最大相关性方法选择特征能够有效平衡数据相关性和冗余之间的关系,在保留最多特征的前提下尽量减少计算量,提升算法的效率。利用部分结构隐藏支持向量机算法的自学习能力降低了对数据标识的要求,能够大幅降低模型训练成本,提升分类器模型的训练效率。
附图说明
图1为本发明实施例方法的基本流程图。
具体实施方式
如图1所示,本实施例基于特征自学习的高精度负荷辨识方法,包括:
1)采集高密度和多维度的电气数据;
2)按照波形抽取方法进行波形切片操作,对波形切进行预筛选,被选中的波形切会被放入波形汇集池中;
3)使用最小冗余和最大相关性方法(minimumredundancyandmaximumrelevance,mrmr)为预筛选后的波形切片选择出最优特征集;
4)利用波形切片的最优特征集对对波形切片建立动态负荷特征模型,将动态负荷特征模型加入特征模型数据库;所述动态负荷特征模型为一个数据集,其格式可以表示为{xi,yi,zi},其中,i为波形序号,xi是对应的最优特征集,yi是波形状态标记,分为有效波形和无效波形两类,zi为波形的类别编号,用于标识其对应的负荷编号;所述特征模型数据库中的模型按照最优特征集的多维空间位置进行定位,使用k均值聚类的方式进行类型划分,每次加入新的动态负荷特征模型时,波形状态标记都为“无效波形”,其对应负荷编号为0;
5)利用部分结构隐藏支持向量机(partiallyhiddenstructuredsvm,psvm)算法对分类器模型进行更新,所述分类器模型为一个组合分类器g,它由多个基分类器组成;当新的动态负荷特征模型加入特征模型数据库时,利用分类器模型对新的动态负荷特征模型进行部分结构隐藏支持向量机分类,如果能够被划分入已有分类,则将该新的动态负荷特征模型标识为该分类,输出负荷种类信息;如果新的动态负荷特征模型无法被分入已有类型,则标记为“无效波形”,并将新的动态负荷特征模型存入特征模型数据库。
本实施例中,步骤1)中采集高密度和多维度的电气数据具体是指超过预设频率阈值的采样频率进行采样得到c维的数据得到高密度和多维度的波形向量{x1,…,xt},其中元素x1~xt都是一个c维的向量,其中c为采样通道的数量,t表示采样采样数据总数。
本实施例中,步骤2)包括:
2.1)针对波形向量{x1,…,xt},使用滑窗的方式对波形向量进行扫描,滑窗的窗口长度为l,对于任意通道i,在时间t时窗口中获得的数据集表示为:
上式中,
2.2)针对任意时窗口中获得的数据集,分别计算其平均值、方差值、最大值、最小值、中间值和熵,并进行下述处理:(1)针对任意采样通道i在t时刻的原始采样数据
2.3)将本窗口的特征向量、下一个窗口的特征向量之间的进行距离计算,若计算得到的距离超过预设阈值dmax,则将该窗口的数据及对应特征向量作为波形切片放入波形汇集池,从而在波形汇集池中得到预筛选后的波形切片。
步骤3)中使用最小冗余和最大相关性方法为预筛选后的波形切片选择出最优特征集时,基于mrmr的最优特征集选择使用数据的互信息作为特征选择的衡量尺度,能够在原始特征集合中找到与最终输出结果相关性最大(max-relevance),但是彼此之间相关性最小的一组特征(min-redundancy),实现了数据相关性和冗余之间的有效的权衡。本实施例中,步骤3)中使用最小冗余和最大相关性方法为预筛选后的波形切片选择出最优特征集包括:
3.1)根据下式针对预筛选后的波形切片执行最大相关性的特征搜索;
上式中,式中,s为所有特征的集合,c为某一个特征类,i(xi;c)为特征集中第i类特征与特征类c的互信息,d(s,c)表示在集合s中搜索到的与c具有最大相关性结果的集合,maxd(s,c)表示该集合中的数据按照从大至小的方式进行排列,d表示最大相关性特征搜索的对应公式。通过最大相关性的选择之后,需要剔除其中互相冗余的部分,这样处理分类结果不会有非常大的变化,但能进一步减小特征规模。
3.2)根据下式针对执行最大相关性的特征搜索的结果执行最小冗余的特征搜索;
上式中,r(s)表示在集合s中搜索到的任意两个元素的相关性结果的集合,minr(s)表示该集合中的数据按照从小至大的方式进行排列,r表示最小冗余搜索的对应公式,i(xi;xj)为特征集中第i类特征与第j类特征的互信息;
3.3)根据下式将执行最大相关性的特征搜索、执行最小冗余的特征搜索进行综合;
maxφ(d,r),φ=d-r
上式中,φ(d,r)表示对应数据集d和r计算得到的mrmr结果集合,maxφ(d,r)表示该集合中的数据按照从大至小的方式进行排列,φ表示mrmr的对应计算公式;
3.4)将综合求出的最优解作为经过mrmr计算得到的最大特征子集sm-1的特征子集,并在x-sm-1中使用以下公式继续择出m个特征作为最优特征集,其中表示总特征集合去掉sm-1特征子集后的剩余特征集合,m表示指定特征的个数;
上式中,i(xj;c)为特征集中第j类特征xj与c的互信息,m表示选出的最优特征集数量,i(xi;xj)为特征集中第i类特征xi与xj的互信息,sm-1表示经过mrmr计算得到的最大特征子集。当求出最优解后,同时也得到了sm-1的特征子集,在x-sm-1中使用以下公式继续选择出第m个特征作为最优特征集,被选出的这m个特征即为该波形的最优特征集。
本实施例中,步骤5)利用部分结构隐藏支持向量机(partiallyhiddenstructuredsvm,psvm)算法对分类器模型进行更新。
本实施例中,步骤5)中组合分类器g的函数表达式为:
其中,g(w,x)表示组合分类器g,w为训练参数矩阵,x为切片波形的最优特征集,f1(w,x)~fk(w,x)分别为第1~k个基分类器,k为所有已被标记过的负荷类别数量。组合分类器g对特征波形执行隐式“聚类”,以便捕获隐藏的子组。考虑非线性情况,本实施例中,步骤5)中组合分类器g的使用了特征映射:
其中,φ表示特征映射集,
其中,基分类器的函数表达式为:
φ(x)表示基分类器的输入,b为偏置;
组合分类器g铰链损失函数为:
[1-yimink{w·φk(xi)}]
其中,φk(xi)表示对xi进行多维希尔伯特空间变换,yi表示xi对应动态负荷特征模型的第二维变量。
本实施例中,步骤5)之后还包括定时根据特征模型数据库对特征模型数据库进行更新的步骤,包括:(1)对已经分类的特征集进行再次训练,得到新的部分结构隐藏支持向量机算法参数;(2)将标记为“无效波形”的模型进行多维k均值聚类,如果某个模型分类数量超过预设的阈值nlim则将其标识为新的分类,实现负荷种类的自动更新,其中新分类对应的实际负荷类型通过人工指定的方式确定。
此外,本实施例还提供一种基于特征自学习的高精度负荷辨识系统,包括相互连接的微处理器和存储器,所述微处理器被编程或配置以执行前述基于特征自学习的高精度负荷辨识方法的步骤,或者所述存储器中存储有被编程或配置以执行前述基于特征自学习的高精度负荷辨识方法的计算机程序。
此外,本实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有被编程或配置以执行前述基于特征自学习的高精度负荷辨识方法的计算机程序。
此外,本实施例还提供一种基于特征自学习的高精度负荷辨识系统,包括:
数据采集程序单元,用于采集高密度和多维度的电气数据,专为工业用户设计,能够提供高采集密度和多维度的电气数据;
特殊波形提取程序单元,用于按照波形抽取方法进行波形切片操作,对波形切进行预筛选,被选中的波形切会被放入波形汇集池中;
最优特征集选择程序单元,用于使用最小冗余和最大相关性方法(minimumredundancyandmaximumrelevance,mrmr)为预筛选后的波形切片选择出最优特征集;
动态负荷特征分析程序单元,用于利用波形切片的最优特征集对对波形切片建立动态负荷特征模型,将动态负荷特征模型加入特征模型数据库;所述动态负荷特征模型为一个数据集,其格式可以表示为{xi,yi,zi},其中,i为波形序号,xi是对应的最优特征集,yi是波形状态标记,分为有效波形和无效波形两类,zi为波形的类别编号,用于标识其对应的负荷编号;所述特征模型数据库中的模型按照最优特征集的多维空间位置进行定位,使用k均值聚类的方式进行类型划分,每次加入新的动态负荷特征模型时,波形状态标记都为“无效波形”,其对应负荷编号为0;
分类识别程序单元,用于利用部分结构隐藏支持向量机算法对分类器模型进行更新,所述分类器模型为一个组合分类器g,它由多个基分类器组成;当新的动态负荷特征模型加入特征模型数据库时,利用分类器模型对新的动态负荷特征模型进行部分结构隐藏支持向量机分类,如果能够被划分入已有分类,则将该新的动态负荷特征模型标识为该分类,输出负荷种类信息;如果新的动态负荷特征模型无法被分入已有类型,则标记为“无效波形”,并将新的动态负荷特征模型存入特征模型数据库。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可读存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
1.一种基于特征自学习的高精度负荷辨识方法,其特征在于,包括:
1)采集高密度和多维度的电气数据;
2)按照波形抽取方法进行波形切片操作,对波形切进行预筛选,被选中的波形切会被放入波形汇集池中;
3)使用最小冗余和最大相关性方法为预筛选后的波形切片选择出最优特征集;
4)利用波形切片的最优特征集对对波形切片建立动态负荷特征模型,将动态负荷特征模型加入特征模型数据库;所述动态负荷特征模型为一个数据集,其格式可以表示为{xi,yi,zi},其中,i为波形序号,xi是对应的最优特征集,yi是波形状态标记,分为有效波形和无效波形两类,zi为波形的类别编号,用于标识其对应的负荷编号;所述特征模型数据库中的模型按照最优特征集的多维空间位置进行定位,使用k均值聚类的方式进行类型划分,每次加入新的动态负荷特征模型时,波形状态标记都为“无效波形”,其对应负荷编号为0;
5)利用部分结构隐藏支持向量机算法对分类器模型进行更新,所述分类器模型为一个组合分类器g,它由多个基分类器组成;当新的动态负荷特征模型加入特征模型数据库时,利用分类器模型对新的动态负荷特征模型进行部分结构隐藏支持向量机分类,如果能够被划分入已有分类,则将该新的动态负荷特征模型标识为该分类,输出负荷种类信息;如果新的动态负荷特征模型无法被分入已有类型,则标记为“无效波形”,并将新的动态负荷特征模型存入特征模型数据库。
2.根据权利要求1所述的基于特征自学习的高精度负荷辨识方法,其特征在于,步骤1)中采集高密度和多维度的电气数据具体是指超过预设频率阈值的采样频率进行采样得到c维的数据得到高密度和多维度的波形向量{x1,…,xt},其中元素x1~xt都是一个c维的向量,其中c为采样通道的数量,t表示采样采样数据总数。
3.根据权利要求2所述的基于特征自学习的高精度负荷辨识方法,其特征在于,步骤2)包括:
2.1)针对波形向量{x1,…,xt},使用滑窗的方式对波形向量进行扫描,滑窗的窗口长度为l,对于任意通道i,在时间t时窗口中获得的数据集表示为:
上式中,
2.2)针对任意时窗口中获得的数据集,分别计算其平均值、方差值、最大值、最小值、中间值和熵,并进行下述处理:(1)针对任意采样通道i在t时刻的原始采样数据
2.3)将本窗口的特征向量、下一个窗口的特征向量之间的进行距离计算,若计算得到的距离超过预设阈值dmax,则将该窗口的数据及对应特征向量作为波形切片放入波形汇集池,从而在波形汇集池中得到预筛选后的波形切片。
4.根据权利要求1所述的基于特征自学习的高精度负荷辨识方法,其特征在于,步骤3)中使用最小冗余和最大相关性方法为预筛选后的波形切片选择出最优特征集包括:
3.1)根据下式针对预筛选后的波形切片执行最大相关性的特征搜索;
上式中,式中,s为所有特征的集合,c为某一个特征类,i(xi;c)为特征集中第i类特征与特征类c的互信息,d(s,c)表示在集合s中搜索到的与c具有最大相关性结果的集合,maxd(s,c)表示该集合中的数据按照从大至小的方式进行排列,d表示最大相关性特征搜索的对应公式。
3.2)根据下式针对执行最大相关性的特征搜索的结果执行最小冗余的特征搜索;
上式中,r(s)表示在集合s中搜索到的任意两个元素的相关性结果的集合,minr(s)表示该集合中的数据按照从小至大的方式进行排列,r表示最小冗余搜索的对应公式,i(xi;xj)为特征集中第i类特征与第j类特征的互信息;
3.3)根据下式将执行最大相关性的特征搜索、执行最小冗余的特征搜索进行综合;
maxφ(d,r),φ=d-r
上式中,φ(d,r)表示对应数据集d和r计算得到的mrmr结果集合,maxφ(d,r)表示该集合中的数据按照从大至小的方式进行排列,φ表示mrmr的对应计算公式;
3.4)将综合求出的最优解作为经过mrmr计算得到的最大特征子集sm-1的特征子集,并在x-sm-1中使用以下公式继续择出m个特征作为最优特征集,其中表示总特征集合去掉sm-1特征子集后的剩余特征集合,m表示指定特征的个数;
上式中,i(xj;c)为特征集中第j类特征xj与c的互信息,m表示选出的最优特征集数量,i(xi;xj)为特征集中第i类特征xi与xj的互信息,sm-1表示经过mrmr计算得到的最大特征子集。
5.根据权利要求1所述的基于特征自学习的高精度负荷辨识方法,其特征在于,步骤5)中组合分类器g的函数表达式为:
其中,g(w,x)表示组合分类器g,w为训练参数矩阵,x为切片波形的最优特征集,f1(w,x)~fk(w,x)分别为第1~k个基分类器,k为所有已被标记过的负荷类别数量。
6.根据权利要求5所述的基于特征自学习的高精度负荷辨识方法,其特征在于,步骤5)中组合分类器g的使用了特征映射:
其中,φ表示特征映射集,
其中,基分类器的函数表达式为:
φ(x)表示基分类器的输入,b为偏置;
组合分类器g铰链损失函数为:
[1-yimink{w·φk(xi)}]
其中,φk(xi)表示对xi进行多维希尔伯特空间变换,yi表示xi对应动态负荷特征模型的第二维变量。
7.根据权利要求1所述的基于特征自学习的高精度负荷辨识方法,其特征在于,步骤5)之后还包括定时根据特征模型数据库对特征模型数据库进行更新的步骤,包括:(1)对已经分类的特征集进行再次训练,得到新的部分结构隐藏支持向量机算法参数;(2)将标记为“无效波形”的模型进行多维k均值聚类,如果某个模型分类数量超过预设的阈值nlim则将其标识为新的分类,实现负荷种类的自动更新,其中新分类对应的实际负荷类型通过人工指定的方式确定。
8.一种基于特征自学习的高精度负荷辨识系统,包括相互连接的微处理器和存储器,其特征在于,所述微处理器被编程或配置以执行权利要求1~7中任意一项所述基于特征自学习的高精度负荷辨识方法的步骤,或者所述存储器中存储有被编程或配置以执行权利要求1~7中任意一项所述基于特征自学习的高精度负荷辨识方法的计算机程序。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有被编程或配置以执行权利要求1~7中任意一项所述基于特征自学习的高精度负荷辨识方法的计算机程序。
10.一种基于特征自学习的高精度负荷辨识系统,其特征在于,包括:
数据采集程序单元,用于采集高密度和多维度的电气数据;
特殊波形提取程序单元,用于按照波形抽取方法进行波形切片操作,对波形切进行预筛选,被选中的波形切会被放入波形汇集池中;
最优特征集选择程序单元,用于使用最小冗余和最大相关性方法为预筛选后的波形切片选择出最优特征集;
动态负荷特征分析程序单元,用于利用波形切片的最优特征集对对波形切片建立动态负荷特征模型,将动态负荷特征模型加入特征模型数据库;所述动态负荷特征模型为一个数据集,其格式可以表示为{xi,yi,zi},其中,i为波形序号,xi是对应的最优特征集,yi是波形状态标记,分为有效波形和无效波形两类,zi为波形的类别编号,用于标识其对应的负荷编号;所述特征模型数据库中的模型按照最优特征集的多维空间位置进行定位,使用k均值聚类的方式进行类型划分,每次加入新的动态负荷特征模型时,波形状态标记都为“无效波形”,其对应负荷编号为0;
分类识别程序单元,用于利用部分结构隐藏支持向量机算法对分类器模型进行更新,所述分类器模型为一个组合分类器g,它由多个基分类器组成;当新的动态负荷特征模型加入特征模型数据库时,利用分类器模型对新的动态负荷特征模型进行部分结构隐藏支持向量机分类,如果能够被划分入已有分类,则将该新的动态负荷特征模型标识为该分类,输出负荷种类信息;如果新的动态负荷特征模型无法被分入已有类型,则标记为“无效波形”,并将新的动态负荷特征模型存入特征模型数据库。
技术总结