本发明涉及客户报障的统计分析领域,尤其是一种olt掉电脱网预警分析方法及装置。
背景技术:
基于客户报障的统计分析数据,有很大一部分的问题是来自于连接光纤的终端设备(olt)到各个用户家庭的线路(onu)停电导致的,目前运营商只能依赖于用户的投诉和运维反馈定位具体的机房停电状态。
随着运营商、政企设备/机房停电频次高,停电面大;发电机不足,人手紧张;部分监控点动环监控缺失、电池续航时间不详等现象,能实时监控并预测问题以提前做出相应的准备就成了当务之急。
技术实现要素:
为克服运营商、政企设备/机房停电频次高,停电面大;发电机不足,人手紧张;部分监控点动环监控缺失、电池续航时间不详等问题,本发明提供一种olt掉电脱网预警分析方法及装置,通过大数据平台的支撑以及分析算法的自我学习,实现了预测问题,提前预警,指导发电,变被动为主动,快速支撑市场,提升客户感知。
为实现上述目的,本发明采用下述技术方案:
在本发明一实施例中,提出了一种olt掉电脱网预警分析方法,该方法包括:
步骤一,跨域数据采集
从综告系统、pon网管、crm系统和aaa系统多维度数据挖掘;
步骤二,构建数据模型
分析历史onu掉电/olt脱网告警数据,通过fp-growth算法分析数据,找出onu掉电与olt脱网强关联的onu、olt设备续航时长及设备同线路关系;
步骤三,实时预测olt停电,给出发电指导
断网前提前预警在线用户数、重要用户数和投诉敏感用户数,预测olt设备脱网;
步骤四,建立闭环流程
向综告系统/电子运维系统发送预测到的olt停电工单,当综告/电子运维接收并处理后回单。
进一步地,步骤一中跨域采集的数据类型包括来自综吿系统的告警类、来自crm系统的客户属性类、来自pon网管的设备属性类和来自aaa系统的aaa日志类。
更进一步地,综吿系统的告警类数据内容包括:olt停电告警、onu告警和申告数据;
crm系统的客户属性类数据内容包括:用户id、用户状态、用户等级、投诉敏感程度和投诉原因;
pon网管的设备属性类数据内容包括:设备标识、变化类型、设备名称、设备管理地址、设备类型、设备型号、管理设备标识、管理设备端口、设备did、设备节点、节点名称、节点级别和地市节点;
aaa系统的aaa日志类数据内容包括用户状态、用户标识和状态更新时间。
更进一步地,olt停电告警包括:告警统计条目编号、告警设备标识、告警类型、告警开始时间、告警级别、告警概述、处理状态、转故障人、转故障时间、清除方式、清除人、清除时间和故障原因;
onu告警包括:告警时间、地市名称、onu设备标识、告警类型和告警恢复时间;
申告数据包括:工单流水号、故障号码、loid、地市、区域/县份、用户地址、派单时间、障碍类型描述、修复一级原因、修复二级原因、修复三级原因、产品类型、速率、故障来源类型和10000号拦截单号。
进一步地,步骤二中构建数据模型,具体包括:
(1)每天分析过去2天告警数据,分析近半年olt脱网告警和onu掉电告警记录;若在olt脱网12小时前,有onu集中停电,则可能是市电停,会对olt掉电造成影响,权重 1并记录olt脱网总次数;
(2)续航时长取olt脱网时间至本批次onu掉电告警最晚时间。
(3)同线路关系:根据历史数据的不断学习,取(1)中权重/olt脱网总次数>50%的同一批onu,每次跟着olt一起掉电的时间间隔,比较该时间间隔是否一致,间隔一致的次数比例是否一致;先纵向比较同一批次的onu的ups,取中位数,如果满足至少3个以上onu掉电,认为掉电与市停电有关,再横向比较满足横向条件onu的续航时长情况,取平均值,如果满足上述情况的占比超过60%,认为同线路关系,否则不用横向比较。
更进一步地,步骤二中构建数据模型,具体还包括:
同线路关系,之后每月执行1次,分析上月数据,来不断学习。
进一步地,步骤三中实时预测olt掉电,给出发电指导,具体包括:
(1)olt脱网预警:实时分析onu最近5分钟的脱网数据,剔除已经恢复的告警,在4分钟内发生集中的同线路onu<3且所有onu都有掉电告警或同线路onu>=3且至少有三个onu掉电则判为市停电,则olt脱网状态为1;
(2)olt脱网预警消除:实时分析onu最近5分钟的脱网数据,取已经恢复的告警,在4分钟内发生集中的同线路onu<3且所有onu都有掉电恢复告警或同线路onu>=3且至少有三个onu掉电恢复则判为市恢复,则olt脱网状态为-1;
(3)olt脱网预警消除:实时分析olt最近15分钟的脱网并已经恢复的记录视为市停电恢复,则olt脱网状态为-2。
(4)聚合olt下近3个月有过报障记录的用户数、关联用户等级和在线用户并记录下来;
(5)olt脱网预警/预警消除状态迁移:一旦发现存在脱网状态为1的即向综告系统/电子运维发送olt脱网预警,内容包括:脱网设备名称、设备ip、续航时长、预测掉电时间、在线用户数、用户等级和投诉敏感用户数。
进一步地,步骤四中建立闭环流程,具体包括:
当综告系统/电子运维接收到syslog停电告警后,地市运维人员根据重要级别确认该olt设备是否告警,如果设备确实停电,待处理后发确认syslog,内容包括:告警类型、告警设备ip、设备机房、保障原因、设备是否告警和续航时长。
在本发明一实施例中,还提出了一种olt掉电脱网预警分析装置,该装置包括:
跨域数据采集模块,用于从综告系统、pon网管、crm系统和aaa系统多维度数据挖掘;
数据综合分析模块,用于分析历史onu掉电/olt脱网告警数据,通过fp-growth算法分析数据,找出onu掉电与olt脱网强关联的onu、olt设备续航时长及设备同线路关系;
实时预测并指导发电模块,用于断网前提前预警在线用户数、重要用户数和投诉敏感用户数,预测olt设备脱网;
闭环流程建立模块,用于向综告系统/电子运维系统发送预测到的olt停电工单,当综告/电子运维接收并处理后回单。
在本发明一实施例中,还提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现前述olt掉电脱网预警分析方法。
在本发明一实施例中,还提出了一种计算机可读存储介质,计算机可读存储介质存储有执行olt掉电脱网预警分析方法的计算机程序。
有益效果:
本发明通过对告警olt下挂的onu的历史停电日志进行分析,并进行不断自我学习,获得olt设备的续航时长,同时结合在线用户数、重要用户数以及投诉敏感用户等信息综合分析,当onu停电时,预测同线路的olt设备停电的可能以及恢复时间,达到在断网前提前向运营商预警的目的,以方便运营商分公司做出发电优先级预判,做好发电管控的准备并提前做好客户通知等工作。
附图说明
图1是本发明一实施例的olt掉电脱网预警分析方法示意图;
图2是本发明一实施例的构建数据模型示意图;
图3是本发明一实施例的olt脱网预警流程图;
图4是本发明一实施例的一种情况下olt脱网预警消除流程图;
图5是本发明一实施例的另一种情况下olt脱网预警消除流程图;
图6是本发明一实施例的olt脱网预警/预警消除状态迁移示意图;
图7是本发明一实施例的olt掉电脱网预警分析装置结构示意图;
图8是本发明一实施例的计算机设备结构示意图。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神,应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本发明的实施方式,提出了一种olt掉电脱网预警分析方法及装置,通过对告警olt下挂的onu的历史停电日志进行分析,并进行不断自我学习,获得olt设备的续航时长,同时结合在线用户数、重要用户数以及投诉敏感用户等信息综合分析;当onu停电时,预测同线路的olt设备停电的可能以及恢复时间,达到在断网前提前向运营商预警的目的,以方便运营商分公司做出发电优先级预判,做好发电管控的准备并提前做好客户通知等工作。
下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。
图1是本发明一实施例的olt掉电脱网预警分析方法示意图。如图1所示,该方法包括:
步骤一,跨域数据采集
从综告系统、pon网管、crm系统和aaa系统多维度数据挖掘。
告警类:
(1)数据来源:综告系统;
(2)数据内容:
olt停电告警:告警统计条目编号、告警设备标识、告警类型、告警开始时间、告警级别、告警概述、处理状态、转故障人、转故障时间、清除方式、清除人、清除时间、故障原因等;
onu告警(ftth):告警时间、地市名称、onu设备标识、告警类型、告警恢复时间;
aaa日志:用户状态、用户标识、状态更新时间;
申告数据:工单流水号、故障号码、loid、地市、区域/县份、用户地址、派单时间、障碍类型描述、修复一级原因、修复二级原因、修复三级原因、产品类型、速率、故障来源类型、10000号拦截单号。
客户属性信息:
(1)数据来源:从企信部crm统获取;
(2)数据内容:用户id,用户状态、用户等级、投诉敏感程度、投诉原因等。
设备属性类:
(1)数据来源:pon网管;
(2)数据内容:
设备标识、变化类型、设备名称、设备管理地址、设备类型、设备型号、管理设备标识、管理设备端口、设备did、设备节点;
设备节点、节点名称、节点级别、地市节点。
步骤二,构建数据模型
分析历史onu掉电/olt脱网告警数据,通过fp-growth算法分析数据,找出onu掉电与olt脱网强关联的onu、olt设备续航时长(ups)及设备同线路关系;
图2是本发明一实施例的构建数据模型示意图。如图2所示,具体包括:
(1)每天分析过去2天告警数据,分析近半年olt脱网告警(通常有备用电源脱网不会立刻停电)、onu掉电告警(脱网会立刻停电)记录。在olt脱网12小时前,有onu集中停电,认为可能是市电停,会对olt掉电造成影响,权重 1,并记录olt脱网总次数。
(2)ups取olt脱网时间–本批次onu掉电告警最晚时间。
(3)同线路关系:根据历史数据的不断学习,取(1)中权重/olt脱网总次数>50%(阀值可配置)的同一批onu,每次跟着olt一起掉电的时间间隔,比较这个时间间隔是否一致(允许10%的误差),间隔一致的次数比例是否一致(可配置,默认上下浮动百分之十),其次,先纵向比较同一批次的onu的ups,取中位数(上下浮动10%),市停电至少需要3个以上onu掉电,如果满足,认为掉电与市停电有关,再横向。否则不用横向比较;横向,比较满足横向条件onu的ups情况,取平均值,上下浮动10%,满足本情况的占比超过60%(可配置)认为同线路关系。
(4)同线路关系,之后每月执行1次,分析上月数据,从而达到不断学习的目的。
步骤三,实时预测olt停电,给出发电指导
断网前提前预警在线用户数、重要用户数和投诉敏感用户数,预测olt设备脱网;具体包括:
(1)图3是本发明一实施例的olt脱网预警流程图,如图3所示,olt脱网预警,具体包括:
实时分析onu最近5分钟的脱网数据,剔除已经恢复的告警,在4分钟内发生集中的同线路onu<3且所有onu都有掉电告警或同线路onu>=3且至少有三个onu掉电则判为市停电,则olt脱网状态为1。
(2)图4是本发明一实施例的一种情况下olt脱网预警消除流程图,如图4所示,olt脱网预警消除,具体包括:
实时分析onu最近5分钟的脱网数据,取已经恢复的告警,在4分钟内发生集中的同线路onu<3且所有onu都有掉电恢复告警或同线路onu>=3且至少有三个onu掉电恢复则判为市恢复,则olt脱网状态为-1。
(3)图5是本发明一实施例的另一种情况下olt脱网预警消除流程图,如图5所示,olt脱网预警消除,具体包括:
实时分析olt最近15分钟的脱网并已经恢复的记录视为市停电恢复,则olt脱网状态为-2。
(4)聚合olt下近3个月有过报障记录的用户数,关联用户等级,在线用户并记录下来。
(5)图6是本发明一实施例的olt脱网预警/预警消除状态迁移示意图,如图6所示,olt脱网预警/预警消除状态迁移,具体包括:
一旦发现存在脱网状态为1的即向综告系统/电子运维发送olt脱网预警,内容包括:脱网设备名称、设备ip、ups时长、预测掉电时间、在线用户数、用户等级、投诉敏感用户数等。
步骤四,建立闭环流程
向综告系统/电子运维系统发送预测到的olt停电工单,当综告/电子运维接收并处理后回单;具体包括:
当综告系统/电子运维接收到syslog停电告警后,地市运维人员根据重要级别,确认该olt设备是否告警,如果设备确实停电待处理后发确认syslog(包括:告警类型、告警设备ip,设备机房、保障原因,设备是否告警、ups时长等),以此算法不断学习,提高其准确性,提高用户接收设备预警的实时性和真实性。
需要说明的是,尽管在上述实施例及附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
为了对上述olt掉电脱网预警分析方法进行更为清楚的解释,下面结合一个具体的实施例来进行说明,然而值得注意的是该实施例仅是为了更好地说明本发明,并不构成对本发明不当的限定。
下面以一个具体实例来更加详细的对olt掉电脱网预警分析方法进一步说明:
告警格式如下:
(1)向syslog接口发送掉电风险告警syslog(包括:告警类型、告警设备ip,告警机房、在线用户数、重要用户数、报障用户数,告警级别等),样例如下:
ite-devmonioltpowerdownalarm:
<oltip>10.121.56.91<roomid>qzh.yglc0/a01<room>钦州市区阳光丽城a01
<在线用户数>866<重要用户数>123<报障用户数>12<告警级别>3<currtime>20200819220017
(2)向syslog接口发送掉电风险告警syslog(包括:告警类型、告警设备ip、告警机房、备注信息等),样例如下:
ite-devmonioltpowerdownrecoveralarm:
<oltip>10.121.56.91<roomid>qzh.yglc0/a01
<room>钦州市区阳光丽城a01<备注>xxxxx<currtime>20200819230017
(3)向syslog接口发送掉电处理告警syslog,样例如下:
ite-devmonioltpowerdownsheetreason:
<oltip>10.121.56.91<roomid>qzh.yglc0/a01<room>钦州市区阳光丽城a01
<报障原因>olt停电,ups太久需更换<设备是否告警>是
<ups时长(小时)>1<备注>xxxxxx
<currtime>20200820210017
基于同一发明构思,本发明还提出一种olt掉电脱网预警分析装置。该装置的实施可以参见上述方法的实施,重复之处不再赘述。以下所使用的术语“模块”,可以是实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图7是本发明一实施例的olt掉电脱网预警分析装置结构示意图。如图7所示,该装置包括:
跨域数据采集模块101,用于从综告系统、pon网管、crm系统和aaa系统多维度数据挖掘;
数据综合分析模块102,用于分析历史onu掉电/olt脱网告警数据,通过fp-growth算法分析数据,找出onu掉电与olt脱网强关联的onu、olt设备续航时长及设备同线路关系;
实时预测并指导发电模块103,用于断网前提前预警在线用户数、重要用户数和投诉敏感用户数,预测olt设备脱网;
闭环流程建立模块104,用于向综告系统/电子运维系统发送预测到的olt停电工单,当综告/电子运维接收并处理后回单。
应当注意,尽管在上文详细描述中提及了olt掉电脱网预警分析装置的若干模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之,上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。
基于前述发明构思,如图8所示,本发明还提出一种计算机设备200,包括存储器210、处理器220及存储在存储器210上并可在处理器220上运行的计算机程序230,处理器220执行计算机程序230时实现前述olt掉电脱网预警分析方法。
基于前述发明构思,本发明还提出一种计算机可读存储介质,计算机可读存储介质存储有执行前述olt掉电脱网预警分析方法的计算机程序。
本发明提出的olt掉电脱网预警分析方法及装置实现跨域数据综合分析,具备合理的同线路判断逻辑;实现设备脱网预警,并针对用户级别、敏感度等给出发电建议;实现预警的级别划分,可在工程管理系统根据级别作出针对性处理。
虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包含的各种修改和等同布置。
对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
1.一种olt掉电脱网预警分析方法,其特征在于,该方法包括:
步骤一,跨域数据采集
从综告系统、pon网管、crm系统和aaa系统多维度数据挖掘;
步骤二,构建数据模型
分析历史onu掉电/olt脱网告警数据,通过fp-growth算法分析数据,找出onu掉电与olt脱网强关联的onu、olt设备续航时长及设备同线路关系;
步骤三,实时预测olt停电,给出发电指导
断网前提前预警在线用户数、重要用户数和投诉敏感用户数,预测olt设备脱网;
步骤四,建立闭环流程
向综告系统/电子运维系统发送预测到的olt停电工单,当综告/电子运维接收并处理后回单。
2.根据权利要求1所述的olt掉电脱网预警分析方法,其特征在于,所述步骤一中跨域采集的数据类型包括来自综吿系统的告警类、来自crm系统的客户属性类、来自pon网管的设备属性类和来自aaa系统的aaa日志类。
3.根据权利要求2所述的olt掉电脱网预警分析方法,其特征在于,所述综吿系统的告警类数据内容包括:olt停电告警、onu告警和申告数据;
所述crm系统的客户属性类数据内容包括:用户id、用户状态、用户等级、投诉敏感程度和投诉原因;
所述pon网管的设备属性类数据内容包括:设备标识、变化类型、设备名称、设备管理地址、设备类型、设备型号、管理设备标识、管理设备端口、设备did、设备节点、节点名称、节点级别和地市节点;
所述aaa系统的aaa日志类数据内容包括用户状态、用户标识和状态更新时间。
4.根据权利要求3所述的olt掉电脱网预警分析方法,其特征在于,所述olt停电告警包括:告警统计条目编号、告警设备标识、告警类型、告警开始时间、告警级别、告警概述、处理状态、转故障人、转故障时间、清除方式、清除人、清除时间和故障原因;
所述onu告警包括:告警时间、地市名称、onu设备标识、告警类型和告警恢复时间;
所述申告数据包括:工单流水号、故障号码、loid、地市、区域/县份、用户地址、派单时间、障碍类型描述、修复一级原因、修复二级原因、修复三级原因、产品类型、速率、故障来源类型和10000号拦截单号。
5.根据权利要求1所述的olt掉电脱网预警分析方法,其特征在于,所述步骤二中构建数据模型,具体包括:
(1)每天分析过去2天告警数据,分析近半年olt脱网告警和onu掉电告警记录;若在olt脱网12小时前,有onu集中停电,则可能是市电停,会对olt掉电造成影响,权重 1并记录olt脱网总次数;
(2)续航时长取olt脱网时间至本批次onu掉电告警最晚时间。
(3)同线路关系:根据历史数据的不断学习,取(1)中权重/olt脱网总次数>50%的同一批onu,每次跟着olt一起掉电的时间间隔,比较该时间间隔是否一致,间隔一致的次数比例是否一致;先纵向比较同一批次的onu的ups,取中位数,如果满足至少3个以上onu掉电,认为掉电与市停电有关,再横向比较满足横向条件onu的续航时长情况,取平均值,如果满足上述情况的占比超过60%,认为同线路关系,否则不用横向比较。
6.根据权利要求5所述的olt掉电脱网预警分析方法,其特征在于,所述步骤二中构建数据模型,具体还包括:
同线路关系,之后每月执行1次,分析上月数据,来不断学习。
7.根据权利要求1所述的olt掉电脱网预警分析方法,其特征在于,所述步骤三中实时预测olt掉电,给出发电指导,具体包括:
(1)olt脱网预警:实时分析onu最近5分钟的脱网数据,剔除已经恢复的告警,在4分钟内发生集中的同线路onu<3且所有onu都有掉电告警或同线路onu>=3且至少有三个onu掉电则判为市停电,则olt脱网状态为1;
(2)olt脱网预警消除:实时分析onu最近5分钟的脱网数据,取已经恢复的告警,在4分钟内发生集中的同线路onu<3且所有onu都有掉电恢复告警或同线路onu>=3且至少有三个onu掉电恢复则判为市恢复,则olt脱网状态为-1;
(3)olt脱网预警消除:实时分析olt最近15分钟的脱网并已经恢复的记录视为市停电恢复,则olt脱网状态为-2。
(4)聚合olt下近3个月有过报障记录的用户数、关联用户等级和在线用户并记录下来;
(5)olt脱网预警/预警消除状态迁移:一旦发现存在脱网状态为1的即向综告系统/电子运维发送olt脱网预警,内容包括:脱网设备名称、设备ip、续航时长、预测掉电时间、在线用户数、用户等级和投诉敏感用户数。
8.根据权利要求1所述的olt掉电脱网预警分析方法,其特征在于,所述步骤四中建立闭环流程,具体包括:
当综告系统/电子运维接收到syslog停电告警后,地市运维人员根据重要级别确认该olt设备是否告警,如果设备确实停电,待处理后发确认syslog,内容包括:告警类型、告警设备ip、设备机房、保障原因、设备是否告警和续航时长。
9.一种olt掉电脱网预警分析装置,其特征在于,该装置包括:
跨域数据采集模块,用于从综告系统、pon网管、crm系统和aaa系统多维度数据挖掘;
数据综合分析模块,用于分析历史onu掉电/olt脱网告警数据,通过fp-growth算法分析数据,找出onu掉电与olt脱网强关联的onu、olt设备续航时长及设备同线路关系;
实时预测并指导发电模块,用于断网前提前预警在线用户数、重要用户数和投诉敏感用户数,预测olt设备脱网;
闭环流程建立模块,用于向综告系统/电子运维系统发送预测到的olt停电工单,当综告/电子运维接收并处理后回单。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-8任一项所述方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1-8任一项所述方法的计算机程序。
技术总结