本发明属于管网的可靠性分析,尤其涉及一种基于事故点信息聚类的管网可靠性分析方法、系统及介质。
背景技术:
1、目前,管网系统是城市的生命线,管网安全直接影响城市安全。通过对破损点信息的聚类分析能够评估城市管网可靠性并辅助地下管网安全管理。现在的管网可靠性分析主要分为两种方法:解析法与模型法。在管网的可靠性方面国内外学者做了许多研究,空间分析模型方面以事故率为模型,该模型通过对管道的直径和材质进行分析以及研究导致爆炸和泄漏的气候、温度等因素,测量管道爆炸和泄漏的情况。在统计分析模型方面,通过对燃气管道泄漏原因进行了相关分析,建立了泄漏预测模型。在天然气力模型方面,使用了flowmaster软件,分析了天然气泵的属性数据和gis系统的实测数据。在聚类方面,国内外研究了多种算法包括基于划分的k-means算法、k-medoids算法、clarans算法,基于层次的birch算法、cure算法、chameleon算法,还有基于密度的dbscan算法、optics算法、denclue算法,基于网络的sting算法、clique算法、wave-cluster算法。国内外大多数都是应用聚类方法对管网的网络拓扑结构进行分析或者是对流量进行分析等,在对管网的破损点进行聚类分析的方面研究较少。
2、通过上述分析,现有技术存在的问题及缺陷为:现有技术都是应用聚类方法对管网的网络拓扑结构进行分析或者是对流量进行分析等,在对管网的破损点进行聚类分析的方面研究较少,导致管网可靠性分析结果不准确。
技术实现思路
1、针对现有技术存在的问题,本发明提供了一种基于事故点信息聚类的管网可靠性分析方法、系统及介质。
2、本发明是这样实现的,一种基于事故点信息聚类的管网可靠性分析方法,所述基于事故点信息聚类的管网可靠性分析方法选择三种聚类方法k-means、dbscan与cure聚类对破损点进行聚类分析并利用开发的公用功能辅助呈现分析结果,通过聚类结果计算并得到密度字段与类别字段并利用这两个字段来表现管线破损情况,最后利用分析结果对管网可靠性进行分析;基于arcgis进行二次开发,对管网的事故点信息进行聚类处理,并通过破损点在所分管网类别中的密度划分破损等级,从而分析管网的可靠性。
3、进一步,所述基于事故点信息聚类的管网可靠性分析方法的k-means聚类算法采用距离作为评价指标,当两个对象的距离越近,相似度就越大,最终获得紧凑且独立的簇;
4、将簇划分为(c1 c2 … ck),目标函数为:
5、
6、式中,k为分的类别数;e为平方误差;x为第i个簇ci中的样本点;μi为簇ci的均值向量,表达式为:
7、
8、k的选择在k-means聚类中很重要,通过先验信息或者迭代获取最合适的值。
9、进一步,所述基于事故点信息聚类的管网可靠性分析方法的dbscan算法将簇定义为密度相连的点的最大集合,把高密度的区域划分为任意形状的类别簇;
10、样本集为d=(x1 x2 … xm),其e邻域为包含样本集d中与xj的距离不大于e的子样本集,表达式为:
11、ne(xi)={xj∈d|dist(xi,xj)≤e}
12、式中,ne(xi)为样本点xi的e邻域的样本点个数;e为设置的半径;xi为核心点,xj为边界点;当|ne(xi)|≥minpts时,xi为核心点,小于样本点为边界点,如果样本点既不是核心点也不是边界点即为噪音点,其中minpts为密度阈值,需要通过先验值或交叉验证法确定。
13、进一步,在建立簇的过程中,若样本点xi与xj满足xi∈ne(xj)且|ne(xj)|≥minpts,则xi由xj直接密度可达,若两个样本点都可由另一个点密度可达,则这两个样本点密度相连。
14、进一步,所述基于事故点信息聚类的管网可靠性分析方法的cure算法采用多个点作为代表点构成一个簇,通过随机取样合分区的方法,通过收缩因子减少离群点对聚类效果的影响,距离质心越远的点收缩程度越大,收缩因子α(0≤α≤1)的选取不同,聚类效果也不同,当收缩因子趋于0时,所有的代表点都汇聚到质心;当收缩因子趋于1时,代表点完全没有收缩,根据先验信息或者交叉验证确定收缩因子能够获得聚类效果。
15、进一步,cure算法通过两个阶段进行异常点的消除,第一阶段是根据簇的增长速度和簇的大小对离群点进行一次识别,将增长速度较慢的类作为异常值剔除;第二阶段是在聚类的最后阶段将非常小的簇剔除。
16、进一步,所述基于事故点信息聚类的管网可靠性分析方法的符号化功能包括唯一值符号化渲染与比例符号化渲染;
17、条形统计图功能能够将每一类的密度统计成条形统计图显示在chart图表中,密度字段的计算步骤为:(1)计算每一类的总点数并求出每一类点的外包多边形;(2)将被每一类的外包多边形包含的管线总长度求出;(3)判断管线总长度是否为0;如果长度不为0,用每一类的总点数除以每一类的管线总长度求得密度并赋给每一个点密度字段,长度接近0的话密度接近1;根据密度判断燃气管网的破损程度,从而分析管网可靠性。
18、本发明的另一目的在于提供一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述基于事故点信息聚类的管网可靠性分析方法。
19、本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述基于事故点信息聚类的管网可靠性分析方法。
20、本发明的另一目的在于提供一种基于所述基于事故点信息聚类的管网可靠性分析方法的基于事故点信息聚类的管网可靠性分析系统,所述基于事故点信息聚类的管网可靠性分析系统,包括:
21、聚类算法选择模块,用于选择三种聚类方法k-means、dbscan与cure聚类对破损点进行聚类分析并利用开发的公用功能辅助呈现分析结果;
22、线管破损描述模块,用于通过聚类结果计算并得到密度字段与类别字段并利用这两个字段来表现管线破损情况;
23、可靠性分析模块,用于利用分析结果对管网可靠性进行分析。
24、结合上述的技术方案和解决的技术问题,本发明所要保护的技术方案所具备的优点及积极效果为:
25、第一、本发明基于arcgis进行二次开发,分别采用k-means、cure和dbscan方法对管网的事故点信息进行聚类处理,并通过破损点在所分管网类别中的密度划分破损等级,从而分析管网的可靠性。利用辽阳市区的一部分地下管网进行了可靠性分析,实验结果表明,通过密度字段来对管网可靠性进行分析的效果显著且便捷,dbscan方法不存在异常类与异常点,且划分的破损等级更精确。本发明选择了理论上比较合适的三种聚类方法k-means、dbscan与cure聚类对破损点进行聚类分析并利用开发的公用功能辅助呈现分析结果,通过聚类结果计算并得到密度字段与类别字段并利用这两个字段来表现管线破损情况,最后利用分析结果对管网可靠性进行分析。
26、三种方法的分析效果也有所不同,采用k-means方法时,管网在边缘处存在一部分破损点数据未参与聚类;采用cure方法时,管网会出现很多异常类;使用dbscan方法不存在异常类与异常点,且划分的破损等级更精确,更适用于作为管网可靠性分析方法。
27、第二,本发明的技术方案转化后的预期收益和商业价值为:本发明通过采用dbscan和cure方法,能够结合dbscan鲁棒性强和cure精准性高的优点,准确识别和分类管网中的破损点,提高了管网可靠性分析的准确度和效率。商业上,这一技术方案能够为城市基础设施管理、水务和燃气公司提供一个高效、准确的管网可靠性分析工具,有助于及时发现和修复管网中的问题,减少维修成本和降低因管网故障造成的损失。同时,本发明的技术方案还有助于提高管网的运营效率和服务质量,增强了用户满意度和社区的安全。
28、本发明的技术方案填补了国内外业内技术空白。在国内外,管网可靠性分析主要依赖于传统的统计方法和一些基础的聚类算法,如k-means。但这些方法在处理管网边缘处的破损点数据时存在一定的局限性。本发明通过采用dbscan方法,不仅能够准确地识别异常类和异常点,还能够更精确地划分破损等级,为管网可靠性分析提供了一种新的、更高效的解决方案,填补了现有技术的空白。
29、本发明的技术方案解决了人们一直渴望解决、但始终未能获得成功的技术难题。本发明成功地解决了传统聚类算法在管网可靠性分析中的局限性和不足,特别是在处理边缘处的破损点数据和精确划分破损等级方面。通过采用dbscan方法,本发明能够提供一个准确、高效和可靠的管网可靠性分析方案,满足了业内长期未能解决的技术需求。
30、本发明的技术方案克服了技术偏见。本发明突破了传统上依赖k-means和cure方法的管网可靠性分析模式,克服了这些方法在处理边缘破损点数据和异常类识别方面的技术偏见。通过采用dbscan方法,本发明为管网可靠性分析提供了一种新的视角和方法,克服了传统技术中的一些固有偏见和局限性,提高了管网可靠性分析的准确性和可靠性。
1.一种基于事故点信息聚类的管网可靠性分析方法,其特征在于,选择三种聚类方法k-means、dbscan与cure聚类对破损点进行聚类分析并利用开发的公用功能辅助呈现分析结果,通过聚类结果计算并得到密度字段与类别字段并利用这两个字段来表现管线破损情况,最后利用分析结果对管网可靠性进行分析;基于arcgis进行二次开发,对管网的事故点信息进行聚类处理,并通过破损点在所分管网类别中的密度划分破损等级,从而分析管网的可靠性。
2.如权利要求1所述的基于事故点信息聚类的管网可靠性分析方法,其特征在于,所述基于事故点信息聚类的管网可靠性分析方法的k-means聚类算法采用距离作为评价指标,当两个对象的距离越近,相似度就越大,最终获得紧凑且独立的簇;
3.如权利要求1所述的基于事故点信息聚类的管网可靠性分析方法,其特征在于,所述基于事故点信息聚类的管网可靠性分析方法的dbscan算法将簇定义为密度相连的点的最大集合,把高密度的区域划分为任意形状的类别簇;
4.如权利要求3所述的基于事故点信息聚类的管网可靠性分析方法,其特征在于,在建立簇的过程中,若样本点xi与xj满足xi∈ne(xj)且|ne(xj)|≥minpts,则xi由xj直接密度可达,若两个样本点都可由另一个点密度可达,则这两个样本点密度相连。
5.如权利要求1所述的基于事故点信息聚类的管网可靠性分析方法,其特征在于,所述基于事故点信息聚类的管网可靠性分析方法的cure算法采用多个点作为代表点构成一个簇,通过随机取样合分区的方法,通过收缩因子减少离群点对聚类效果的影响,距离质心越远的点收缩程度越大,收缩因子α(0≤α≤1)的选取不同,聚类效果也不同,当收缩因子趋于0时,所有的代表点都汇聚到质心;当收缩因子趋于1时,代表点完全没有收缩,根据先验信息或者交叉验证确定收缩因子能够获得聚类效果。
6.如权利要求5所述的基于事故点信息聚类的管网可靠性分析方法,其特征在于,cure算法通过两个阶段进行异常点的消除,第一阶段是根据簇的增长速度和簇的大小对离群点进行一次识别,将增长速度较慢的类作为异常值剔除;第二阶段是在聚类的最后阶段将非常小的簇剔除。
7.如权利要求1所述的基于事故点信息聚类的管网可靠性分析方法,其特征在于,所述基于事故点信息聚类的管网可靠性分析方法的符号化功能包括唯一值符号化渲染与比例符号化渲染;
8.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1~7任意一项所述基于事故点信息聚类的管网可靠性分析方法。
9.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行权利要求1~7任意一项所述基于事故点信息聚类的管网可靠性分析方法。
10.一种基于权利要求1~7任意一项所述基于事故点信息聚类的管网可靠性分析方法的基于事故点信息聚类的管网可靠性分析系统,其特征在于,所述基于事故点信息聚类的管网可靠性分析系统,包括:
