一种基于两步贝叶斯网络的光伏异常数据清洗方法及系统与流程

    专利2026-04-06  13


    本发明属于可再生能源发电,具体涉及一种基于两步贝叶斯网络的光伏异常数据清洗方法及系统。


    背景技术:

    1、近年来,随着经济迅速发展和能源需求不断增加,太阳能作为一种清洁、可再生能源备受瞩目并快速发展。光伏阵列是太阳能发电系统的核心组件,由多个光伏电池板构成,通常安装在户外环境。

    2、然而,光伏系统可能会受到多种因素的影响,如温度、辐照度等,这些因素可能导致系统产生异常数据,从而降低光伏系统的效率,增加了能源浪费和维护成本。随着对可再生能源的依赖程度增加,确保光伏系统的高效率和经济性变得至关重要,异常数据的清洗有助于优化系统运行,减少能源浪费和维护成本。为了确保光伏系统的高效运行,需要进行持续的性能监测,异常数据的清洗是监测系统性能并及时采取措施来防止系统故障的关键步骤。


    技术实现思路

    1、本发明的目的在于提供一种基于两步贝叶斯网络的光伏异常数据清洗方法及系统,以解决光伏系统受到影响产生异常数据,从而效率降低,增加了能源浪费和维护成本的问题。

    2、为了解决上述技术问题,本发明采用如下技术方案:

    3、第一方面,本发明提供一种基于两步贝叶斯网络的光伏异常数据清洗方法,包括以下步骤:

    4、获取样本数据,所述样本数据包括:光伏电流、光伏电压、温度和辐照度;

    5、对样本数据进行处理,得到第一样本集;

    6、根据第一样本集,基于贝叶斯网络建立光伏电流条件概率模型;

    7、根据光伏电流条件概率模型得到光伏电流条件概率置信区间,将第一样本集中光伏电流条件概率置信区间外的光伏电流数据和对应的光伏电压、温度和辐照度数据删除,得到第二样本集;

    8、根据第二样本集,基于贝叶斯网络建立光伏电压条件概率模型;

    9、根据光伏电压条件概率模型得到光伏电压条件概率置信区间,将第二样本集中光伏电压条件概率置信区间外的光伏电压数据和对应的光伏电流、温度和辐照度数据删除,得到清洗过的样本数据;

    10、输出清洗过的样本数据。

    11、可选的,所述对样本数据进行处理,得到第一样本集的步骤,具体包括:

    12、对样本数据进行缺失值补充,得到预处理过的样本数据;

    13、基于高斯核函数对预处理过的样本数据进行概率积分变换,得到第一样本集。

    14、可选的,所述根据第一样本集,基于贝叶斯网络建立光伏电流条件概率模型的步骤,具体包括:

    15、计算第一样本集中光伏电流、温度和辐照度两两之间连续概率值对的互信息数,按照互信息数从大到小的顺序排列互信息数对应的连续概率值对,确定初始结构顺序,得到电流有向无环图,电流有向无环图中包括父节点、子节点和有指向的箭头;有指向的箭头表示父节点和子节点之间的条件概率;

    16、采用等宽离散化方法,将第一样本集中的连续概率值转换为概率离散值,等宽离散化的离散区间数目为100;

    17、依据电流有向无环图,采用k2的结构学习算法对贝叶斯网络进行结构学习,贝叶斯网络结构学习结果为电流最佳有向无环图;

    18、采用最大似然值估计法对电流最佳有向无环图中父节点与子节点之间的条件概率进行估计,得到电流最佳有向无环图中父节点与子节点之间的条件概率表,从而建立光伏电流条件概率模型。

    19、可选的,所述有向无环图中,有指向的箭头根部的节点为父节点,有指向的箭头指向的节点为子节点;父节点和子节点为概率离散值。

    20、可选的,所述根据光伏电流条件概率模型得到光伏电流条件概率置信区间的步骤,具体包括:

    21、从电流最佳有向无环图中的父节点到子节点遍历采样,得到多维随机变量概率的概率离散值矩阵表示如下:

    22、

    23、式中:i=1,2…n,表示贝叶斯网络的网络节点数;di=1,2,…m,表示采样次数;为第i个节点经过di次采样得到的离散值向量;表示n个节点经过di次采样后的概率离散值矩阵;

    24、将概率离散值矩阵中的概率离散值还原到等宽离散化区间,等宽离散化区间数目为100,在等宽离散化区间内取均匀分布的随机数,得到连续的概率值向量,所有连续的概率值向量构成m×n维概率值矩阵;

    25、概率值矩阵经反概率积分变换得到电流条件概率分布表,在电流条件概率分布表中查询条件概率为0.04和0.98的光伏电流值,将条件概率在0.04和0.98之间的光伏电流值区间作为光伏电流条件概率置信区间。

    26、可选的,所述根据第二样本集,基于贝叶斯网络建立光伏电压条件概率模型的步骤,具体包括:

    27、计算第二样本集中光伏电压、温度和辐照度两两之间连续概率值对的互信息数,按照互信息数从大到小的顺序排列互信息数对应的连续概率值对,确定第二结构顺序,得到电压有向无环图;电压有向无环图中包括父节点、子节点和有指向的箭头;有指向的箭头表示父节点和子节点之间的条件概率;

    28、采用等宽离散化方法,将第二样本集中的连续概率值转换为概率离散值,等宽离散化的离散区间数目为100;

    29、根据电压有向无环图,采用k2的结构学习算法对贝叶斯网络进行结构学习,贝叶斯网络结构学习结果为电压最佳有向无环图;

    30、采用最大似然值估计法对电压最佳有向无环图中父节点与子节点之间的条件概率进行估计,得到电压最佳有向无环图中父节点与子节点之间的条件概率表,从而建立光伏电压条件概率模型。

    31、可选的,所述根据光伏电压条件概率模型得到光伏电压条件概率置信区间的步骤,具体包括:

    32、从电压最佳有向无环图中的父节点到子节点遍历采样,得到多维随机变量概率的概率离散值矩阵表示如下:

    33、

    34、式中:i=1,2…n,表示贝叶斯网络的网络节点数;di=1,2,…m,表示采样次数;为第i个节点经过di次采样得到的离散值向量;表示n个节点经过di次采样后的概率离散值矩阵;

    35、将概率离散值矩阵中的概率离散值还原到等宽离散化区间,等宽离散化区间数目为100,在等宽离散化区间内取均匀分布的随机数,得到连续的概率值向量,所有连续的概率值向量构成m×n维概率值矩阵;

    36、概率值矩阵经反概率积分变换得到电压条件概率分布表,在电压条件概率分布表中查询条件概率为0.04和0.98的光伏电压值,将条件概率在0.04和0.98之间的光伏电压值区间作为光伏电压条件概率置信区间。

    37、第二方面,本发明提供一种基于两步贝叶斯网络的光伏异常数据清洗系统,包括:

    38、数据获取模块,用于获取样本数据,所述样本数据包括:光伏电流、光伏电压、温度和辐照度;

    39、数据处理模块,用于对样本数据进行处理,得到第一样本集;

    40、第一建模模块,用于根据第一样本集,基于贝叶斯网络建立光伏电流条件概率模型;

    41、第一清洗模块,用于根据光伏电流条件概率模型得到光伏电流条件概率置信区间,将第一样本集中光伏电流条件概率置信区间外的光伏电流数据和对应的光伏电压、温度和辐照度数据删除,得到第二样本集;

    42、第二建模模块,用于根据第二样本集,基于贝叶斯网络建立光伏电压条件概率模型;

    43、第二清洗模块,用于根据光伏电压条件概率模型得到光伏电压条件概率置信区间,将第二样本集中光伏电压条件概率置信区间外的光伏电压数据和对应的光伏电流、温度和辐照度数据删除,得到清洗过的样本数据;

    44、输出模块,用于输出清洗过的样本数据。

    45、可选的,所述对样本数据进行处理,得到第一样本集的步骤,具体包括:

    46、对样本数据进行缺失值补充,得到预处理过的样本数据;

    47、基于高斯核函数对预处理过的样本数据进行概率积分变换,得到第一样本集。

    48、可选的,所述根据第一样本集,基于贝叶斯网络建立光伏电流条件概率模型的步骤,具体包括:

    49、计算第一样本集中光伏电流、温度和辐照度两两之间连续概率值对的互信息数,按照互信息数从大到小的顺序排列互信息数对应的连续概率值对,确定初始结构顺序,得到电流有向无环图,电流有向无环图中包括父节点、子节点和有指向的箭头;有指向的箭头表示父节点和子节点之间的条件概率;

    50、采用等宽离散化方法,将第一样本集中的连续概率值转换为概率离散值,等宽离散化的离散区间数目为100;

    51、依据电流有向无环图,采用k2的结构学习算法对贝叶斯网络进行结构学习,贝叶斯网络结构学习结果为电流最佳有向无环图;

    52、采用最大似然值估计法对电流最佳有向无环图中父节点与子节点之间的条件概率进行估计,得到电流最佳有向无环图中父节点与子节点之间的条件概率表,从而建立光伏电流条件概率模型。

    53、可选的,所述有向无环图中,有指向的箭头根部的节点为父节点,有指向的箭头指向的节点为子节点;父节点和子节点为概率离散值。

    54、可选的,所述根据光伏电流条件概率模型得到光伏电流条件概率置信区间的步骤,具体包括:

    55、从电流最佳有向无环图中的父节点到子节点遍历采样,得到多维随机变量概率的概率离散值矩阵表示如下:

    56、

    57、式中:i=1,2…n,表示贝叶斯网络的网络节点数;di=1,2,…m,表示采样次数;为第i个节点经过di次采样得到的离散值向量;表示n个节点经过di次采样后的概率离散值矩阵;

    58、将概率离散值矩阵中的概率离散值还原到等宽离散化区间,等宽离散化区间数目为100,在等宽离散化区间内取均匀分布的随机数,得到连续的概率值向量,所有连续的概率值向量构成m×n维概率值矩阵;

    59、概率值矩阵经反概率积分变换得到电流条件概率分布表,在电流条件概率分布表中查询条件概率为0.04和0.98的光伏电流值,将条件概率在0.04和0.98之间的光伏电流值区间作为光伏电流条件概率置信区间。

    60、可选的,所述根据第二样本集,基于贝叶斯网络建立光伏电压条件概率模型的步骤,具体包括:

    61、计算第二样本集中光伏电压、温度和辐照度两两之间连续概率值对的互信息数,按照互信息数从大到小的顺序排列互信息数对应的连续概率值对,确定第二结构顺序,得到电压有向无环图;电压有向无环图中包括父节点、子节点和有指向的箭头;有指向的箭头表示父节点和子节点之间的条件概率;

    62、采用等宽离散化方法,将第二样本集中的连续概率值转换为概率离散值,等宽离散化的离散区间数目为100;

    63、根据电压有向无环图,采用k2的结构学习算法对贝叶斯网络进行结构学习,贝叶斯网络结构学习结果为电压最佳有向无环图;

    64、采用最大似然值估计法对电压最佳有向无环图中父节点与子节点之间的条件概率进行估计,得到电压最佳有向无环图中父节点与子节点之间的条件概率表,从而建立光伏电压条件概率模型。

    65、可选的,所述根据光伏电压条件概率模型得到光伏电压条件概率置信区间的步骤,具体包括:

    66、从电压最佳有向无环图中的父节点到子节点遍历采样,得到多维随机变量概率的概率离散值矩阵表示如下:

    67、

    68、式中:i=1,2…n,表示贝叶斯网络的网络节点数;di=1,2,…m,表示采样次数;为第i个节点经过di次采样得到的离散值向量;表示n个节点经过di次采样后的概率离散值矩阵;

    69、将概率离散值矩阵中的概率离散值还原到等宽离散化区间,等宽离散化区间数目为100,在等宽离散化区间内取均匀分布的随机数,得到连续的概率值向量,所有连续的概率值向量构成m×n维概率值矩阵;

    70、概率值矩阵经反概率积分变换得到电压条件概率分布表,在电压条件概率分布表中查询条件概率为0.04和0.98的光伏电压值,将条件概率在0.04和0.98之间的光伏电压值区间作为光伏电压条件概率置信区间。

    71、第三方面,本发明提供一种电子设备,包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序以实现所述的一种基于两步贝叶斯网络的光伏异常数据清洗方法。

    72、第四方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质存储有至少一个指令,所述至少一个指令被处理器执行时实现所述的一种基于两步贝叶斯网络的光伏异常数据清洗方法。

    73、与现有技术相比,本发明具有以下有益效果:

    74、本发明提供一种基于两步贝叶斯网络的光伏异常数据清洗方法及系统,所述方法包括:

    75、获取样本数据,所述样本数据包括:光伏电流、光伏电压、温度和辐照度;对样本数据进行处理,得到第一样本集;根据第一样本集,基于贝叶斯网络建立光伏电流条件概率模型;根据光伏电流条件概率模型得到光伏电流条件概率置信区间,将第一样本集中光伏电流条件概率置信区间外的光伏电流数据和对应的光伏电压、温度和辐照度数据删除,得到第二样本集;根据第二样本集,基于贝叶斯网络建立光伏电压条件概率模型;根据光伏电压条件概率模型得到光伏电压条件概率置信区间,将第二样本集中光伏电压条件概率置信区间外的光伏电压数据和对应的光伏电流、温度和辐照度数据删除,得到清洗过的样本数据;输出清洗过的样本数据。

    76、本发明充分考虑了温度、辐照度的环境影响因素,并将电流和电压分开进行异常数据辨识,进行精确的光伏异常数据清洗,确保了光伏系统的高效运行,减少了能源浪费,降低了维护成本。


    技术特征:

    1.一种基于两步贝叶斯网络的光伏异常数据清洗方法,其特征在于,包括以下步骤:

    2.根据权利要求1所述的一种基于两步贝叶斯网络的光伏异常数据清洗方法,其特征在于,所述对样本数据进行处理,得到第一样本集的步骤,具体包括:

    3.根据权利要求2所述的一种基于两步贝叶斯网络的光伏异常数据清洗方法,其特征在于,所述根据第一样本集,基于贝叶斯网络建立光伏电流条件概率模型的步骤,具体包括:

    4.根据权利要求3所述的一种基于两步贝叶斯网络的光伏异常数据清洗方法,其特征在于,所述有向无环图中,有指向的箭头根部的节点为父节点,有指向的箭头指向的节点为子节点;父节点和子节点为概率离散值。

    5.根据权利要求4所述的一种基于两步贝叶斯网络的光伏异常数据清洗方法,其特征在于,所述根据光伏电流条件概率模型得到光伏电流条件概率置信区间的步骤,具体包括:

    6.根据权利要求4所述的一种基于两步贝叶斯网络的光伏异常数据清洗方法,其特征在于,所述根据第二样本集,基于贝叶斯网络建立光伏电压条件概率模型的步骤,具体包括:

    7.根据权利要求6所述的一种基于两步贝叶斯网络的光伏异常数据清洗方法,其特征在于,所述根据光伏电压条件概率模型得到光伏电压条件概率置信区间的步骤,具体包括:

    8.一种基于两步贝叶斯网络的光伏异常数据清洗系统,其特征在于,包括:

    9.根据权利要求8所述的一种基于两步贝叶斯网络的光伏异常数据清洗系统,其特征在于,所述对样本数据进行处理,得到第一样本集的步骤,具体包括:

    10.根据权利要求9所述的一种基于两步贝叶斯网络的光伏异常数据清洗系统,其特征在于,所述根据第一样本集,基于贝叶斯网络建立光伏电流条件概率模型的步骤,具体包括:

    11.根据权利要求10所述的一种基于两步贝叶斯网络的光伏异常数据清洗系统,其特征在于,所述有向无环图中,有指向的箭头根部的节点为父节点,有指向的箭头指向的节点为子节点;父节点和子节点为概率离散值。

    12.根据权利要求11所述的一种基于两步贝叶斯网络的光伏异常数据清洗系统,其特征在于,所述根据光伏电流条件概率模型得到光伏电流条件概率置信区间的步骤,具体包括:

    13.根据权利要求11所述的一种基于两步贝叶斯网络的光伏异常数据清洗系统,其特征在于,所述根据第二样本集,基于贝叶斯网络建立光伏电压条件概率模型的步骤,具体包括:

    14.根据权利要求13所述的一种基于两步贝叶斯网络的光伏异常数据清洗系统,其特征在于,所述根据光伏电压条件概率模型得到光伏电压条件概率置信区间的步骤,具体包括:

    15.一种电子设备,其特征在于,包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序以实现如权利要求1至7中任意一项所述的一种基于两步贝叶斯网络的光伏异常数据清洗方法。

    16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有至少一个指令,所述至少一个指令被处理器执行时实现如权利要求1至7中任意一项所述的一种基于两步贝叶斯网络的光伏异常数据清洗方法。


    技术总结
    本发明属于可再生能源发电技术领域,具体涉及一种基于两步贝叶斯网络的光伏异常数据清洗方法及系统。所述方法包括:获取样本数据并处理,得到第一样本集;样本数据包括:光伏电流、光伏电压、温度和辐照度;根据第一样本集,建立光伏电流条件概率模型并进一步得到光伏电流条件概率置信区间,将置信区间外的电流和对应的数据删除,得到第二样本集;根据第二样本集,建立光伏电压条件概率模型并进一步得到光伏电压条件概率置信区间,将置信区间外的电压和对应的数据删除,得到清洗过的样本数据。本发明考虑了温度、辐照度的影响,将电流和电压分开进行异常数据清洗,确保光伏系统高效运行,减少能源浪费,降低了维护成本。

    技术研发人员:王诜,郭帅,宋玮琼,李海涛,赵乐,赵成,宋威,韩柳,李季巍,宋彦辛,吕凤鸣
    受保护的技术使用者:国网北京市电力公司
    技术研发日:
    技术公布日:2024/4/29
    转载请注明原文地址:https://wp.8miu.com/read-96495.html

    最新回复(0)