线上服务故障演练方法、电子设备及存储介质与流程

    专利2025-04-09  20


    本发明实施例涉及计算机,具体涉及一种线上服务故障演练方法、电子设备及存储介质。


    背景技术:

    1、线上服务故障演练,已有技术都是通过自研或者开源工具对线上服务进行真正的代码入侵,从而触发服务的监控报警来实现的,而在实际业务中,每个业务服务选择的语言不同,入侵代码的入侵手段和成本也不一样,有的语言到目前为止还没有开发出代码入侵的工具,因此代码入侵的方式进行故障演练通用性差、成本较高。另外,更重要的是代码入侵后发生故障会对业务的运行造成影响。


    技术实现思路

    1、针对现有技术存在的缺陷,本发明实施例提供一种线上服务故障演练方法、电子设备及存储介质。

    2、本发明实施例提供一种线上服务故障演练方法,包括:通过调用服务实例对应的接口发送故障演练任务;其中,所述故障演练任务包括服务id、服务实例id及故障演练信息,所述故障演练信息包括预先写好的日志内容,所述服务id和所述服务实例id唯一对应于所述服务实例;将所述日志内容写入所述服务实例的临时日志文件,利用日志采集组件监听所述临时日志文件中更新的日志内容,基于监听到的所述日志内容及预设的报警规则进行报警决策。

    3、根据本发明实施例提供的一种线上服务故障演练方法,所述基于监听到的所述日志内容及预设的报警规则进行报警决策,包括:获取业务正常运行时的日志存储方式,基于所述日志存储方式将监听到的所述日志内容进行存储;获取基于所述日志存储方式存储的所述日志内容,基于所述日志内容及预设的报警规则进行报警决策。

    4、根据本发明实施例提供的一种线上服务故障演练方法,所述接口是通过所述服务实例的代理组件提供的;所述将所述日志内容写入所述服务实例的临时日志文件,包括:利用所述日志内容替换所述代理组件的模式化脚本中的预设内容,得到代理组件运行脚本;通过运行所述代理组件运行脚本将所述日志内容写入所述服务实例的临时日志文件。

    5、根据本发明实施例提供的一种线上服务故障演练方法,所述故障演练信息还包括写入频率;所述将所述日志内容写入所述服务实例的临时日志文件,包括:根据所述写入频率将所述日志内容写入所述服务实例的临时日志文件。

    6、根据本发明实施例提供的一种线上服务故障演练方法,所述将所述日志内容写入所述服务实例的临时日志文件,包括:响应于所述服务实例的预设目录下不存在所述临时日志文件,则在所述预设目录下创建所述临时日志文件,将所述日志内容写入所述临时日志文件;响应于所述服务实例的所述预设目录下存在所述临时日志文件,则通过追加内容的方式将所述日志内容写入所述临时日志文件。

    7、根据本发明实施例提供的一种线上服务故障演练方法,所述方法还包括:在检测到所述日志内容符合所述报警规则后,发送相应的报警信息给预设接收方持有的终端设备,以供所述预设接受方根据所述报警信息进行止损操作。

    8、根据本发明实施例提供的一种线上服务故障演练方法,所述方法还包括:获取所述止损操作产生的止损记录,根据所述止损记录及所述故障演练任务的任务内容判断所述止损操作的正确性,并给出故障演练得分。

    9、根据本发明实施例提供的一种线上服务故障演练方法,所述通过调用服务实例对应的接口发送故障演练任务,包括:将所述故障演练任务发送到具有调用所述服务实例的接口的操作权限的调度中心,通过所述调度中心调用所述服务实例的接口发送所述故障演练任务。

    10、本发明实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述线上服务故障演练方法的步骤。

    11、本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述线上服务故障演练方法的步骤。

    12、本发明实施例还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述线上服务故障演练方法的步骤。

    13、本发明实施例提供的线上服务故障演练方法、电子设备及存储介质,通过调用服务实例对应的接口发送故障演练任务,故障演练任务包括服务id、服务实例id及故障演练信息,故障演练信息包括预先写好的日志内容,服务id和服务实例id唯一对应于服务实例,将日志内容写入服务实例的临时日志文件,利用日志采集组件监听临时日志文件中更新的日志内容,基于监听到的日志内容及预设的报警规则进行报警决策,提供了一种对线上业务无损的服务故障演练方案,不需要对原业务代码进行代码入侵,降低了线上服务故障演练的成本,提高了线上故障演练的安全性和效果。



    技术特征:

    1.一种线上服务故障演练方法,其特征在于,包括:

    2.根据权利要求1所述的线上服务故障演练方法,其特征在于,所述基于监听到的所述日志内容及预设的报警规则进行报警决策,包括:

    3.根据权利要求1所述的线上服务故障演练方法,其特征在于,所述接口是通过所述服务实例的代理组件提供的;所述将所述日志内容写入所述服务实例的临时日志文件,包括:

    4.根据权利要求1所述的线上服务故障演练方法,其特征在于,所述故障演练信息还包括写入频率;所述将所述日志内容写入所述服务实例的临时日志文件,包括:

    5.根据权利要求1所述的线上服务故障演练方法,其特征在于,所述将所述日志内容写入所述服务实例的临时日志文件,包括:

    6.根据权利要求1所述的线上服务故障演练方法,其特征在于,所述方法还包括:

    7.根据权利要求6所述的线上服务故障演练方法,其特征在于,所述方法还包括:

    8.根据权利要求1所述的线上服务故障演练方法,其特征在于,所述通过调用服务实例对应的接口发送故障演练任务,包括:

    9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至8任一项所述线上服务故障演练方法的步骤。

    10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述线上服务故障演练方法的步骤。


    技术总结
    本发明实施例提供一种线上服务故障演练方法、电子设备及存储介质,该方法包括:通过调用服务实例对应的接口发送故障演练任务;其中,故障演练任务包括服务ID、服务实例ID及故障演练信息,故障演练信息包括预先写好的日志内容,服务ID和服务实例ID唯一对应于服务实例;将日志内容写入服务实例的临时日志文件,利用日志采集组件监听临时日志文件中更新的日志内容,基于监听到的日志内容及预设的报警规则进行报警决策。本发明实施例提供了一种对线上业务无损的服务故障演练方案,降低了线上服务故障演练的成本,提高了线上故障演练的安全性和效果。

    技术研发人员:刘春锋,赵宁
    受保护的技术使用者:贝壳找房(北京)科技有限公司
    技术研发日:
    技术公布日:2024/4/29
    转载请注明原文地址:https://wp.8miu.com/read-85246.html

    最新回复(0)