本发明涉及卫星通信领域,特别是涉及基于卫星通信的地面站内多设备及服务系统的自动监测控制。
背景技术:
我国属于自然灾害多发国家,加之国土面积大以及灾害发生不确定性,相关单位和人员参加抢险救灾行动在时间和空间上都具有很大的随机性,卫星通信由于不受地域限制,不受地面网运营商基站限制,通信质量不受地震等严重自然灾害影响,成为重要的应急通信方式。
当面对重大灾情时,为应对高频次,随机性的通讯需求,指挥中心(中心站)的通信可靠性成为一场重大灾情救援指挥的短板。
目前市面上基于卫星通信的网络,大多都需要中央站维护人员的日常运维检查,无法做到实时监控,无法应对突发性设备故障或服务系统异常情况,无法保证整个通讯网络时刻处于正常工作状态以应对突发的集中式通讯指挥需求。
技术实现要素:
发明目的:本发明的目的是提供一种解决现有技术中存在的缺陷的一种卫星通信的分布式故障实时监测与备用设备切换方法。
技术方案:本发明所述的一种卫星通信的分布式故障实时监测与备用设备切换方法,管控服务系统对站内设备或服务系统进行主动发现,并对站内设备或服务系统工作状态进行实时监管,自动推送当前所有设备及服务系统配置信息,根据管控服务系统监管情况,由管控服务系统系统自动完成设备及服务系统的状态通告及故障设备或服务系统的主备切换。
进一步,对站内设备或服务进行主动发现包括基于网络的服务探测,基于网络的服务探测包括以下步骤:
s11:管控服务系统通过udp协议以广播或组播的方式发送探测消息帧;
s12:设备或服务系统侦听到探测消息帧后,定向发送响应应答消息帧至探测广播发起源管控服务系统;
s13:源管控服务系统接收并解析完成响应应答消息帧,完成设备或服务系统的主动发现动作。
进一步,对站内设备或服务系统工作状态进行实时监管包括基于网络的探测应答处理,基于网络的探测应答处理包括以下步骤:
s21:管控服务系统接收到设备或服务系统的响应应答消息帧;
s22:管控服务系统获取探测响应的设备或服务系统在管控服务系统中缓存的配置参数;
s23:根据故障状态标识获取情况进行判断:若未获取到故障状态标识,则设备或服务系统为首次接入管控服务系统管控网络,将响应消息解析出的配置参数(以下简称已有故障状态标识)缓存至管控服务系统;若获取到故障状态标识,则将故障状态标识与已有故障状态标识进行比较判断:若故障状态标识与已有故障状态标识相同,则保持故障状态标识不变;若故障状态标识不同于已有故障状态标识,则以故障状态标识为标准,下发参数设置命令,纠正设备或服务系统配置参数。
进一步,自动完成设备及服务系统的状态通告包括基于网络的状态通告,基于网络的状态通告包括以下步骤:
s31:管控服务系统获取系统内缓存的所有设备或服务系统的故障状态标识集合故障状态标识list;
s32:管控服务系统获取系统内配置的探测无应答最大容忍时间限度;
s33:遍历故障状态标识list,逐个计算故障状态标识最后一次更新时间与当前时间的差值(以下简称时间差),并判断时间差与探测无应答最大容忍时间限度大小:若时间差<探测无应答最大容忍时间限度,则保持故障状态标识状态正常;若时间差>探测无应答最大容忍时间限度,则变更故障状态标识状态为故障;
s34:管控服务系统通过网络以广播或组播的方式全量发送状态通告消息。
进一步,自动完成故障设备及服务系统主备包括基于网络的参数设置,基于网络的参数设置包括以下步骤:
s41:管控服务系统获取系统内缓存的所有处于主用状态设备或服务系统的故障状态标识集合故障状态标识list;
s42:管控服务系统获取系统内配置的探测无应答最大容忍时间限度;
s43:遍历故障状态标识list,逐个计算故障状态标识最后一次更新时间与当前时间的差值,并判断时间差与探测无应答最大容忍时间限度大小:若时间差<探测无应答最大容忍时间限度,则跳过改记录;若时间差>探测无应答最大容忍时间限度,则在管控服务系统系统内挑选相同类型的设备或服务系统,并且状态正常的备用设备或服务系统,将原故障的设备或服务系统的故障状态标识,通过参数设置命令将故障状态标识配置到备用设备或服务系统上,然后变更管控服务系统缓存中的故障状态标识(原故障的主用变更为备用,原正常态的备用变更为主用)。
有益效果:本发明公开了一种卫星通信系统的设备故障监测与备用设备切换方法,通过管控服务系统对全站设备及服务系统进行主动发现与监测,并根据监测情况,自动完成对设备或服务系统的状态通告及主备切换。本发明能够实现中央站及关口站的设备状态实时监控,并且故障监测与切换均由管控服务系统系统自动完成,极大地提高了中央站及关口站设备及服务系统运行的可靠度,同时有效解决了人工监测与切换的效率低下问题。
附图说明
图1为本发明具体实施方式中一种卫星通信系统故障检测与备用设备切换方法的流程图
图2为本发明具体实施方式中管控系统的示意图;
图3为本发明具体实施方式中服务探测协议参数;
图4为本发明具体实施方式中服务探测应答协议参数;
图5为本发明具体实施方式中状态通告协议参数;
图6为本发明具体实施方式中基于管控系统工作流程图。
具体实施方式
本具体实施方式针对的管控系统如图1所示,包括1个管控服务系统、多个设备及多个不同类型的服务系统。
(一)开发环境
系统软件使用java中的spring-boot架构逻辑,后台使用的框架有:
spring-boot-starter-web(后台分层结构);
mybatis(数据库操作层);
alibabafastjson(序列化与反序列化);
hikari(数据源);
mariadb(数据库)。
(二)部署方式
管控服务系统属于后台系统软件,部署在卫星中心站的应用服务器上,接入控制交换机c-switchboard。
其它类型的服务系统,部署在卫星中心站或关口站的应用服务器上,接入c-switchboard。
卫星中心站或关口站遵循管控协议的设备,控制口接入c-switchboard。
系统软件部署方式参见图1。
(三)运行环境
1)硬件环境
应用服务器:
配备2个8核cpu,主频2.5ghz以上,内存配置32g,硬盘500g。
数据库服务器:
配备2个8核cpu,主频2.5ghz以上,内存配置32g,2个sata/sas10k1t磁盘。
2)软件环境
应用服务器:
操作系统:centoslinux8;
web容器:nginx1.19.0;
java环境:openjdk14.0.1
数据库服务器:
操作系统:centoslinux8;
数据库软件:mariadb-10.4.12;
(四)系统实现方法
系统采用b/s架构,严格按照javaee标准进行开发,基于openjdk14.0.1使用spring-boot-2.3.0.release轻量级框架进行开发。
本具体实施方式公开了一种卫星通信系统的设备故障监测与备用设备切换方法,如图1所示,管控服务系统对站内设备或服务系统进行主动发现,并对站内设备或服务系统工作状态进行实时监管,自动推送当前所有设备及服务系统配置信息,根据管控服务系统监管情况,由管控服务系统系统自动完成设备及服务系统的状态通告及故障设备或服务系统的主备切换。
图2为网络连接示意图,管控服务系统对站内设备或服务进行主动发现包括基于网络的服务探测,基于网络的服务探测包括以下步骤:
s11:管控服务系统通过udp协议如图3,图4,图5,以广播或组播的方式发送探测消息帧;
s12:设备或服务系统侦听到探测消息帧后,定向发送响应应答消息帧至探测广播发起源管控服务系统;
s13:源管控服务系统接收并解析完成响应应答消息帧,完成设备或服务系统的主动发现动作。
对站内设备或服务系统工作状态进行实时监管包括基于网络的探测应答处理,基于网络的探测应答处理包括以下步骤:
s21:管控服务系统接收到设备或服务系统的响应应答消息帧;
s22:管控服务系统获取探测响应的设备或服务系统在管控服务系统中缓存的配置参数;
s23:根据故障状态标识获取情况进行判断:若未获取到故障状态标识,则设备或服务系统为首次接入管控服务系统管控网络,将响应消息解析出的配置参数(以下简称已有故障状态标识)缓存至管控服务系统;若获取到故障状态标识,则将故障状态标识与已有故障状态标识进行比较判断:若故障状态标识与已有故障状态标识相同,则保持故障状态标识不变;若故障状态标识不同于已有故障状态标识,则以故障状态标识为标准,下发参数设置命令,纠正设备或服务系统配置参数。
自动完成设备及服务系统的状态通告包括基于网络的状态通告,基于网络的状态通告包括以下步骤:
s31:管控服务系统获取系统内缓存的所有设备或服务系统的故障状态标识集合故障状态标识list;
s32:管控服务系统获取系统内配置的探测无应答最大容忍时间限度(以下简称探测无应答最大容忍时间限度);
s32:遍历故障状态标识list,逐个计算故障状态标识最后一次更新时间与当前时间的差值(以下简称时间差),并判断时间差与探测无应答最大容忍时间限度大小:若时间差<探测无应答最大容忍时间限度,则保持故障状态标识状态正常;若时间差>探测无应答最大容忍时间限度,则变更故障状态标识状态为故障;
s33:管控服务系统通过网络以广播或组播的方式全量发送状态通告消息。
自动完成故障设备及服务系统主备包括基于网络的参数设置,如图6,基于网络的参数设置包括以下步骤:
s41:管控服务系统获取系统内缓存的所有处于主用状态设备或服务系统的故障状态标识集合故障状态标识list;
s42:管控服务系统获取系统内配置的探测无应答最大容忍时间限度;
s42:遍历故障状态标识list,逐个计算故障状态标识最后一次更新时间与当前时间的差值(以下简称时间差),并判断时间差与探测无应答最大容忍时间限度大小:若时间差<探测无应答最大容忍时间限度,则跳过改记录;若时间差>探测无应答最大容忍时间限度,则在管控服务系统系统内挑选相同类型的设备或服务系统,并且状态正常的备用设备或服务系统,将原故障的设备或服务系统的故障状态标识,通过参数设置命令将故障状态标识配置到备用设备或服务系统上,然后变更管控服务系统缓存中的故障状态标识(原故障的主用变更为备用,原正常态的备用变更为主用)。
1.一种卫星通信的分布式故障实时监测与备用设备切换方法,其特征在于:管控服务系统对站内设备或服务系统进行主动发现,并对站内设备或服务系统工作状态进行实时监管,自动推送当前所有设备及服务系统配置信息,根据管控服务系统监管情况,由管控服务系统系统自动完成设备及服务系统的状态通告及故障设备或服务系统的主设备和备用设备切换;
步骤如下:
s1.卫星通信系统设立专用管控服务器运行管控服务系统;
s2.管控服务系统通过窄带控制信道,实时接收卫星网络中的故障警报帧;
s3.管控服务系统自动完成全网设备及全网服务系统的状态通告;
s4.管控服务系统按生成备用设备接入网络的网络参数;
s5.管控服务系统根据主被动获得的故障帧,自动响应并发送切换至备用设备控制帧完成故障排除。
2.根据权利要求1所述的一种卫星通信的分布式故障实时监测与备用设备切换方法,其特征在于:对站内设备或服务进行主动发现包括基于网络的服务探测,基于网络的服务探测包括以下步骤:
s11:管控服务系统通过udp协议以广播或组播的方式发送探测消息帧;
s12:设备或服务系统侦听到探测消息帧后,定向发送响应应答消息帧至探测广播发起源管控服务系统;
s13:源管控服务系统接收并解析完成响应应答消息帧,完成设备或服务系统的主动发现动作。
3.根据权利要求1所述的一种卫星通信的分布式故障实时监测与备用设备切换方法,其特征在于:对站内设备或服务系统工作状态进行实时监管包括基于网络的探测应答处理,基于网络的探测应答处理包括以下步骤:
s21:管控服务系统接收到网内设备或网内服务系统的响应应答消息帧;
s22:管控服务系统获取探测响应帧中的故障状态标识;
s23:根据故障状态标识获取情况进行判断:若未获取到故障状态标识,则设备或服务系统为首次接入管控服务系统管控网络,将数据库服务器中的已有故障状态标识缓存至管控服务系统;若获取到故障状态标识,则将故障状态标识与已有故障状态标识进行比较判断:若故障状态标识与已有故障状态标识相同,则保持故障状态标识不变;若故障状态标识不同于已有故障状态标识,则以故障状态标识为标准。
4.根据权利要求1所述的一种卫星通信的分布式故障实时监测与备用设备切换方法,其特征在于:自动完成设备及服务系统的状态通告包括基于网络的状态通告,基于网络的状态通告包括以下步骤:
s31:管控服务系统获取系统内缓存的所有设备或服务系统的故障状态标识集合故障状态标识list;
s32:管控服务系统获取系统内配置的探测无应答最大容忍时间限度;
s33:遍历故障状态标识list,逐个计算故障状态标识最后一次更新时间与当前时间的差值(以下简称时间差),并判断时间差与探测无应答最大容忍时间限度大小:若时间差<探测无应答最大容忍时间限度,则保持故障状态标识状态正常;若时间差>探测无应答最大容忍时间限度,则变更故障状态标识状态为故障;
s34:管控服务系统通过网络以广播或组播的方式全量发送状态通告消息。
5.根据权利要求1所述的一种卫星通信的分布式故障实时监测与备用设备切换方法,其特征在于:自动完成故障设备及服务系统主设备和备用设备的切换,同时对新接入设备进行基于网络的参数设置,基于网络的参数设置包括以下步骤:
s41:管控服务系统获取系统内缓存的所有处于主用状态设备或服务系统的故障状态标识集合故障状态标识list;
s42:管控服务系统获取系统内配置的探测无应答最大容忍时间限度;
s43:遍历故障状态标识list,逐个计算故障状态标识最后一次更新时间与当前时间的差值,并判断时间差与探测无应答最大容忍时间限度大小:若时间差<探测无应答最大容忍时间限度,则跳过改记录;若时间差>探测无应答最大容忍时间限度,则在管控服务系统系统内挑选相同类型的设备或服务系统,并且状态正常的备用设备或服务系统,将原故障的设备或服务系统的故障状态标识,通过参数设置命令将故障状态标识配置到备用设备或服务系统上,然后变更管控服务系统缓存中的故障状态标识(原故障的主用变更为备用,原正常态的备用变更为主用)。
技术总结