本发明涉及信息安全,具体而言,涉及一种数据泄露溯源方法及装置。
背景技术:
1、数据作为新型生产要素,是数字化、网络化、智能化的基础,已快速融入生产、分配、流通、消费和社会服务管理等各环节,深刻改变着生产方式、生活方式和社会治理方式。激活数据要素潜能,做强做优做大数字经济,增强经济发展新动能,构筑国家企业竞争新优势已成为当今国家企业发展的重中之重。然而在数据流通共享需求面前国家数据安全、个人信息维护、商业秘密保护成为必须要解决的一大问题。
2、数据泄露溯源定位追责加强节点防范是数据安全防护的重要环节。目前常用的数据泄露溯源方法是水印法,即通过给数据打上用户标识水印,后续通过水印直接定位找到泄露节点。这种方法简单粗暴,但是隐蔽性不够,易被识别出来后做去水印处理。一种好的泄露溯源方法是依据脱敏母规则为每一个用户生成用户专属脱敏规则,真实数据由专属脱敏规则生成不同的脱敏数据,脱敏数据就和用户有了映射关系。依据用户专属脱敏规则对真实数据脱敏与泄露的脱敏数据匹配或者对泄露的脱敏数据进行还原处理后与真实数据匹配,找到这种映射关系即可定位泄露源头。这种方法对直接水印法做了改进,有一定的隐蔽性,但是不同用户看到的脱敏数据是不同的,可溯源性还是会被发现,另外就是需要为用户生成唯一规则变量用于从脱敏母规则生成专属规则,新增一个母规则后,专属规则的数量会倍增,增加大量系统开销。因此,如何找到一种隐蔽的数据泄露溯源方法,并尽量减少系统开销成为一个亟待解决的技术问题。
技术实现思路
1、鉴于此,本发明提出了一种数据泄露溯源方法及装置,旨在解决现有数据泄露溯源存在可溯源的隐蔽性差、溯源效率低、系统开销大的问题。
2、第一方面,本发明实施例提供了一种数据泄露溯源方法,包括:获取泄露数据、用户日志数据和真实数据;基于所述泄露数据,得到包含有第一脱敏规则的泄露数据集;基于所述泄露数据集和所述用户日志数据,得到包含有时间戳的待匹配数据集;将所述待匹配数据集中的数据与真实数据中的数据进行比对,并根据比对一致的数据的时间戳,从所述用户日志数据中确定数据泄露源。
3、进一步地,基于所述泄露数据,得到包含有第一脱敏规则的泄露数据集,包括:根据预设脱敏项字段,从所述泄露数据中提取脱敏数据,并按照脱敏项将所述脱敏数据进行拆分,得到泄露数据集,其中,泄露数据集包括脱敏项、拆分的泄露数据和第一脱敏规则。
4、进一步地,所述用户日志数据包括用户下载日志数据,基于所述泄露数据集和所述用户日志数据,得到包含有时间戳的待匹配数据集,包括:从用户下载日志数据中获取用户下载的时间戳列表;以所述时间戳列表中的时间戳为规则变量,结合所述泄露数据集中的第一脱敏规则,生成第二脱敏规则;基于所述第二脱敏规则,对所述泄露数据集进行逆脱敏处理,得到待匹配数据集,其中待匹配数据集包括脱敏项、待匹配数据和时间戳。
5、进一步地,所述用户日志数据包括用户下载日志数据和用户查询日志数据,将所述待匹配数据集中的数据与真实数据中的数据进行比对,并根据比对一致的数据的时间戳,从所述用户日志数据中确定数据泄露源,包括:将所述待匹配数据集中的数据与真实数据中的数据进行比对,得到比对一致的数据;根据所述比对一致的数据的时间戳,并结合数据泄露的形式,从用户下载日志数据或用户查询日志数据中确定数据泄露源。
6、第二方面,本发明实施例还提供了一种数据泄露溯源装置,包括:获取单元,用于获取泄露数据、用户日志数据和真实数据;第一处理单元,用于基于所述泄露数据,得到包含有第一脱敏规则的泄露数据集;第二处理单元,用于基于所述泄露数据集和所述用户日志数据,得到包含有时间戳的待匹配数据集;溯源单元,用于将所述待匹配数据集中的数据与真实数据中的数据进行比对,并根据比对一致的数据的时间戳,从所述用户日志数据中确定数据泄露源。
7、进一步地,所述第一处理单元,还用于:根据预设脱敏项字段,从所述泄露数据中提取脱敏数据,并按照脱敏项将所述脱敏数据进行拆分,得到泄露数据集,其中,泄露数据集包括脱敏项、拆分的泄露数据和第一脱敏规则。
8、进一步地,所述第二处理单元,还用于:从用户下载日志数据中获取用户下载的时间戳列表;以所述时间戳列表中的时间戳为规则变量,结合所述泄露数据集中的第一脱敏规则,生成第二脱敏规则;基于所述第二脱敏规则,对所述泄露数据集进行逆脱敏处理,得到待匹配数据集,其中待匹配数据集包括脱敏项、待匹配数据和时间戳。
9、进一步地,所述溯源单元,还用于:将所述待匹配数据集中的数据与真实数据中的数据进行比对,得到比对一致的数据;根据所述比对一致的数据的时间戳,并结合数据泄露的形式,从用户下载日志数据或用户查询日志数据中确定数据泄露源。
10、第三方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现上述各实施例提供的数据泄露溯源方法。
11、第四方面,本发明实施例还提供了一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述各实施例提供的数据泄露溯源方法。
12、本发明实施例提供的数据泄露溯源方法及装置,通过基于泄露数据,得到包含有第一脱敏规则的泄露数据集,基于泄露数据集和用户日志数据,得到包含有时间戳的待匹配数据集,以及将待匹配数据集中的数据与真实数据中的数据进行比对,并根据比对一致的数据的时间戳,从用户日志数据中确定数据泄露源,增加了可溯源的隐蔽性,缩减了衍生脱敏规则的数量,减少逆脱敏次数,提高泄露溯源效率。
1.一种数据泄露溯源方法,其特征在于,包括:
2.根据权利要求1所述的数据泄露溯源方法,其特征在于,基于所述泄露数据,得到包含有第一脱敏规则的泄露数据集,包括:
3.根据权利要求1所述的数据泄露溯源方法,其特征在于,所述用户日志数据包括用户下载日志数据,基于所述泄露数据集和所述用户日志数据,得到包含有时间戳的待匹配数据集,包括:
4.根据权利要求1所述的数据泄露溯源方法,其特征在于,所述用户日志数据包括用户下载日志数据和用户查询日志数据,将所述待匹配数据集中的数据与真实数据中的数据进行比对,并根据比对一致的数据的时间戳,从所述用户日志数据中确定数据泄露源,包括:
5.一种数据泄露溯源装置,其特征在于,包括:
6.根据权利要求5所述的数据泄露溯源装置,其特征在于,所述第一处理单元,还用于:
7.根据权利要求5所述的数据泄露溯源装置,其特征在于,所述第二处理单元,还用于:
8.根据权利要求5所述的数据泄露溯源装置,其特征在于,所述溯源单元,还用于:
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时,实现权利要求1-4任一所述的数据泄露溯源方法。
10.一种电子设备,包括: