一种基于单访问目的IP的异常流量识别方法、介质及设备与流程

    专利2025-11-19  2


    所属的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。根据本发明的这种实施方式的电子设备。电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。电子设备以通用计算设备的形式表现。电子设备的组件可以包括但不限于:上述至少一个处理器、上述至少一个储存器、连接不同系统组件(包括储存器和处理器)的总线。其中,储存器存储有程序代码,程序代码可以被处理器执行,使得处理器执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。储存器可以包括易失性储存器形式的可读介质,例如随机存取储存器(ram)和/或高速缓存储存器,还可以进一步包括只读储存器(rom)。储存器还可以包括具有一组(至少一个)程序模块的程序/实用工具,这样的程序模块包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。总线可以为表示几类总线结构中的一种或多种,包括储存器总线或者储存器控制器、外围总线、图形加速端口、处理器或者使用多种总线结构中的任意总线结构的局域总线。电子设备也可以与一个或多个外部设备(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备交互的设备通信,和/或与使得该电子设备能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口进行。并且,电子设备还可以通过网络适配器与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。网络适配器通过总线与电子设备的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。此外,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。


    背景技术:

    1、vpn(virtual private network,虚拟专用网络)是一种通过安全性较低的网络(如internet)创建安全加密连接的技术,可以被当做专网使用和管理,拥有同专有网络一样的安全性和可管理性。其主要功能是在公用网络上建立专用网络,进行加密通讯。以便于用户可以通过该技术异地远程访问对应内网的服务器资源。当然,基于vpn技术,也出现了相关的网络实施网络匿名和代理技术以访问全球互联网资源的行为。也即通过vpn技术规避国家网络监管,突破ip封锁、内容过滤、域名劫持、流量限制等,非法访问被国家禁止的境外网站的行为。

    2、如图6所示,通常实施网络匿名和代理技术以访问全球互联网资源的行为是通过用户在pc终端上下载安装各类“网络加速器”或“vpn应用”等实施网络匿名和代理技术以访问全球互联网资源的行为工具,将原始访问数据包加密封装成为新的用于访问vpn服务器的数据包,并发送至vpn服务器上,然后再由vpn服务器与对应的境外网站进行相应的访问,并将接收到的响应数据包再回传至pc终端上,以完成实施网络匿名和代理技术以访问全球互联网资源的行为。

    3、由于,在实际使用过程中,vpn服务器通常为某一vpn服务器集群中的某一个或几个。具体的,由哪些vpn服务器为pc终端提供对应服务类型的连接服务,需要根据该vpn服务器集群中的服务器管理策略来确定。并且也会根据当前的服务器的繁忙状态及通信流量类型,来确定以短连接还是长连接进行通信。

    4、由此,在这种复杂的通信状态下,更加难以对异常的实施网络匿名和代理技术以访问全球互联网资源的行为流量进行准确有效的识别。


    技术实现思路

    1、针对上述技术问题,本发明采用的技术方案为:

    2、根据本发明的一个方面,提供了一种基于单访问目的ip的异常流量识别方法,方法包括如下步骤:

    3、响应于目标终端对浏览器的开启指令,获取第二监控时段内的多个连接会话流量;连接会话流量包括多个长连接会话流量及多个短连接会话流量;每一长连接会话流量包括多个会话组,每一短连接会话流量包括一个会话组,会话组包括一个请求数据包及一个对应的响应数据包;

    4、对获取到的所有请求数据包的目的ip进行聚类处理,生成至少一个ip族群;每一ip族群唯一对应一种目的ip;

    5、若ip族群为一个,则对第二监控时段内的多个连接会话流量进行第三特征编码处理,生成第三目标访问特征图;

    6、将第三目标访问特征图输入训练好的第三胶囊神经网络中,得到第三目标访问特征图对应的识别结果;

    7、第三特征编码处理包括:

    8、根据每一会话组中请求数据包及响应数据包的大小及生成时间,生成每一会话组对应的会话特征向量;其中,aab为第a个连接会话流量中的第b个会话组对应的会话特征向量,aab=(qab,xab,tab);qab为aab中请求数据包的大小;xab为aab中响应数据包的大小;tab为aab中请求数据包与响应数据包中的时间间隔;

    9、按照每一连接会话流量中请求数据包的最早请求时间,由早到晚对每一个连接会话流量进行排序,生成连接序列;

    10、按照每一长连接会话流量中会话组的建立时间,由早到晚进行排序,生成每一长连接会话流量中的会话序列;

    11、按照连接序列及会话序列,依次将每一会话组对应的会话特征向量填入第三初始访问特征图对应顺序的像素单元中;其中,第三初始访问特征图中包括多行竖向依次排列的特征行,每一特征行中包括多个横向依次排列的像素单元;以及设置于多个特征行前端的连接类型标识列,连接类型标识列中包括与特征行数量相同的多个类型标识单元;

    12、若当前的会话特征向量所属的会话连接类型与上一相邻的会话特征向量所属的会话连接类型不同,则将当前的会话特征向量填入新特征行的像素单元中;

    13、根据每一特征行中会话特征向量所属的会话连接类型,为对应的类型标识单元配置对应的连接标识,以生成第三目标访问特征图。

    14、根据本发明的第二个方面,提供了一种非瞬时性计算机可读存储介质,非瞬时性计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述的一种基于单访问目的ip的异常流量识别方法。

    15、根据本发明的第三个方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述的一种基于单访问目的ip的异常流量识别方法。

    16、本发明至少具有以下有益效果:

    17、本发明中首先对获取到的所有请求数据包的目的ip进行聚类处理,由此来确认第二监控时段内的多个连接会话流量是否为pc终端与同一vpn服务器之间的通信。若ip族群为一个,则表明pc终端仅与同一vpn服务器进行通信。在此基础上,对于不同的通信场景会使用的不同的类型的方式进行通信。在需要频繁交换数据的场景中,如聊天室和实时游戏等需要保持连续通信的场景,则使用长连接进行通信。在数据刷新频度较低的场景中,如网页浏览场景中。由于用户量巨大,服务器难以承受过多的长连接,因此通常使用短连接。

    18、本发明中的第三特征编码处理可以将短连接及长连接,根据其出现的时间分别布置在不同的特征行中。通常一个长连接会对应一种访问服务,短连接中可能至少存在一种访问服务。在长短连接切换时,则表明用户的访问服务出现了变化。由此,第三特征编码处理可以将短连接及长连接分别布置在不同的特征行并配置对应的连接标识,进而可以在第三目标访问特征图竖向空间上体现出访问服务类型出现变化的特征。

    19、另外,在通过实施网络匿名和代理技术以访问全球互联网资源的行为来浏览境外信息的过程中,大部分的的用户会通过几个常用的境外浏览器或者对应的应用程序来查询浏览相关信息。而在此过程中,用户在初始使用境外浏览器或者对应的应用程序时,前几次访问请求的相似性会更高。如通常在使用浏览器查询对应的信息时,首先需要访问对应浏览器的首页,然后再根据访问的数据的类型选择进入对应的子页,甚至在此过程中会涉及到账号的登录验证等前期准备操作。由此,会使得使用同一服务的这些前期的实施网络匿名和代理技术以访问全球互联网资源的访问流量的相似度会更高。

    20、基于上述特征,可以通过连接会话流量中请求数据包及响应数据包中未加密的请求头部分的信息进行编码,以生成能够反映用户访问行为特征的第三目标访问特征图。其中,同一特征行中会话组的先后顺序,可以反映用户使用同一服务时的行为特征;不同特征行的前后顺序,可以反映用户使用不同服务时的行为特征。由此,可以将用户的访问行为习惯转化为特征图的空间特征,可以通过特征图更好的反映用户实施网络匿名和代理技术以访问全球互联网资源的行为时的特征。以便于胶囊神经网络可以更加准确有效的识别出这些异常流量。


    技术特征:

    1.一种基于单访问目的ip的异常流量识别方法,其特征在于,所述方法包括如下步骤:

    2.根据权利要求1所述的方法,其特征在于,按照连接序列及会话序列,依次将每一会话组对应的会话特征向量填入第三初始访问特征图对应顺序的像素单元中,包括:

    3.根据权利要求1所述的方法,其特征在于,按照连接序列及会话序列,依次将每一会话组对应的会话特征向量填入第三初始访问特征图对应顺序的像素单元中,包括:

    4.根据权利要求3所述的方法,其特征在于,按照连接序列及会话序列,依次将每一会话组对应的会话特征向量填入第三初始访问特征图对应顺序的像素单元中,包括:

    5.根据权利要求1所述的方法,其特征在于,在根据每一会话组中请求数据包及响应数据包的大小及生成时间,生成每一会话组对应的会话特征向量之前,所述第三特征编码处理还包括:

    6.根据权利要求1所述的方法,其特征在于,根据每一会话组中请求数据包及响应数据包的大小及生成时间,生成每一会话组对应的会话特征向量,包括:

    7.根据权利要求6所述的方法,其特征在于,在根据所述响应数据包的大小归属的数据量区间,确定所述响应数据包对应的大小标识之前,所述方法还包括:

    8.根据权利要求7所述的方法,其特征在于,在根据所述请求数据包的大小归属的数据量区间,确定所述请求数据包对应的大小标识之前,所述方法还包括:

    9.一种非瞬时性计算机可读存储介质,所述非瞬时性计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述的一种基于单访问目的ip的异常流量识别方法。

    10.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8任一项所述的一种基于单访问目的ip的异常流量识别方法。


    技术总结
    本发明涉及异常流量检测领域,特别是涉及一种基于单访问目的IP的异常流量识别方法、介质及设备。包括:对获取到的所有请求数据包的目的IP进行聚类处理,若IP族群为一个,则对多个连接会话流量进行第三特征编码处理,生成第三目标访问特征图;再通过第三胶囊神经网络得到对应的识别结果。本发明可以将短连接及长连接分别布置在不同的特征行并配置对应的连接标识,进而在第三目标访问特征图竖向空间上体现出访问服务类型变化的特征。且同一特征行反映同一服务的行为特征;不同特征行反映不同服务的行为特征。由此,将访问行为习惯转化为特征图的空间特征,以更加准确有效的对实施网络匿名和代理技术以访问全球互联网资源的访问流量进行识别预测。

    技术研发人员:李峰,孙晓鹏,郭举,王玉红
    受保护的技术使用者:山东云天安全技术有限公司
    技术研发日:
    技术公布日:2024/4/29
    转载请注明原文地址:https://wp.8miu.com/read-92142.html

    最新回复(0)