本发明涉及互联网技术领域,尤其涉及一种数据安全处理方法、装置、设备及存储介质。
背景技术:
企业的信息数据是无形资产,泄露会导致利益损失。企业一般会做一些数据安全管控,如通过磁盘阵列、数据备份、异地容灾等手段保证数据的安全,但是仍然止不住数据泄密。在企业数据安全工作的开展过程中,最常见的处置方式为,采用现代密码算法对数据进行主动保护,如数据保密、数据完整性、双向强身份认证等。但是最大的弊端就是,需要依赖人员的能动性,去主动的、有意识的进行加密。这样会导致数据的安全性较低,还会降低数据安全的处理效率。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
技术实现要素:
本发明的主要目的在于提供了一种数据安全处理方法、装置、设备及存储介质,旨在解决如何提高数据的安全性,进而提高数据安全的处理效率的技术问题。
为实现上述目的,本发明提供了一种数据安全处理方法,所述数据安全处理方法包括:
获取业务系统中的多个元数据及各元数据对应的字段长度,并根据各元数据对应的字段长度对元数据进行分类,获得多个元数据集;
获取各元数据集对应的数据安全级别,并根据所述数据安全级别查找数据脱敏规则;
根据所述数据脱敏规则对所述数据安全级别对应元数据集中的所有元数据进行脱敏处理,以获得多个目标安全数据。
可选地,所述获取业务系统中的多个元数据及各元数据对应的字段长度的步骤,包括:
获取业务系统中的多个加密数据及各加密数据对应的字段类型;
根据所述字段类型从映射关系表中查找各加密数据对应的解密算法;
根据所述解密算法对各加密数据进行解密处理,获得多个元数据及各元数据对应的字段长度。
可选地,所述根据各元数据对应的字段长度对元数据进行分类,获得多个元数据集的步骤,包括:
获取各元数据之间的数据连接关系,并将所有的元数据按照所述数据连接关系构成数据血缘分析图;
提取各元数据中包含的敏感数据;
根据所述敏感数据、所述字段长度及所述数据血缘分析图分别对各元数据进行分类,获得多个元数据集。
可选地,所述提取各元数据中包含的敏感数据的步骤,包括:
分别将各元数据输入至预设敏感识别模型中,以获得各元数据对应的敏感识别度及所述敏感识别度对应的敏感识别类型;
根据所述敏感识别度和所述敏感识别类型确定各元数据对应的敏感数据。
可选地,所述根据所述数据脱敏规则对所述数据安全级别对应元数据集中的所有元数据进行脱敏处理,以获得多个目标安全数据的步骤之后,还包括:
根据所述数据血缘分析图对所有的目标安全数据进行渲染处理,获得敏感数据分布图;
统计所有的目标安全数据总数量,并根据所述目标安全数据总数量确定预设划分规则;
根据所述预设划分规则对所述敏感数据分布图进行分割处理,以获得多个敏感区域分布图;
分别对所述敏感区域分布图中的各目标安全数据进行数据安全风险评估。
可选地,所述分别对所述敏感区域分布图中的各目标安全数据进行数据安全风险评估的步骤,包括:
分别获取各敏感区域分布图对应的安全等级警示颜色;
在所述安全等级警示颜色为预设高危险警示颜色时,获取所述预设高危险警示颜色对应的目标敏感区域分布图;
将所述目标敏感区域分布图输入至预设敏感分析模型中,以获得所述目标敏感区域分布图对应的敏感数据占比值;
判断所述敏感数据占比值大于或等于预设敏感数据占比阈值;
在所述敏感数据占比值大于或等于所述预设敏感数据占比阈值时,获取所述目标敏感区域分布图包含的目标安全数据,并对各目标安全数据进行数据安全分析评估。
可选地,所述对各目标安全数据进行数据安全分析评估的步骤之后,还包括:
分别将各目标安全数据输入至预设数据安全风险评估模型中,以获得各目标安全数据对应的数据安全风险评估值;
判断所述数据安全风险评估值是否大于或等于预设风险评估阈值;
在所述数据安全风险评估值大于或等于所述预设风险评估阈值时,对所述目标安全数据进行销毁处理。
此外,为实现上述目的,本发明还提出一种数据安全处理装置,所述数据安全处理装置包括:
获取模块,用于获取业务系统中的多个元数据及各元数据对应的字段长度,并根据各元数据对应的字段长度对元数据进行分类,获得多个元数据集;
查找模块,用于获取各元数据集对应的数据安全级别,并根据所述数据安全级别查找数据脱敏规则;
处理模块,用于根据所述数据脱敏规则对所述数据安全级别对应元数据集中的所有元数据进行脱敏处理,以获得多个目标安全数据。
此外,为实现上述目的,本发明还提出一种数据安全处理设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据安全处理程序,所述数据安全处理程序配置为实现如上文所述的数据安全处理方法的步骤。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有数据安全处理程序,所述数据安全处理程序被处理器执行时实现如上文所述的数据安全处理方法的步骤。
本发明首先获取业务系统中的多个元数据及各元数据对应的字段长度,并根据各元数据对应的字段长度对元数据进行分类,获得多个元数据集,然后获取各元数据集对应的数据安全级别,并根据数据安全级别查找数据脱敏规则,最后根据数据脱敏规则对数据安全级别对应元数据集中的所有元数据进行脱敏处理,以获得多个目标安全数据。相较于现有技术,需要对数据进行主动防护,但这样会降低数据的处理效率,而本发明中根据元数据对应的数据安全级别确定数据脱敏规则,从而根据数据脱敏规则对元数据进行脱敏处理,实现了在保证数据安全性的同时,从而提高了元数据的处理效率。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的数据安全处理设备的结构示意图;
图2为本发明数据安全处理方法第一实施例的流程示意图;
图3为本发明数据安全处理方法第二实施例的流程示意图;
图4为本发明数据安全处理装置第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的数据安全处理设备结构示意图。
如图1所示,该数据安全处理设备可以包括:处理器1001,例如中央处理器(centralprocessingunit,cpu),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(wireless-fidelity,wi-fi)接口)。存储器1005可以是高速的随机存取存储器(randomaccessmemory,ram)存储器,也可以是稳定的非易失性存储器(non-volatilememory,nvm),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对数据安全处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、数据存储模块、网络通信模块、用户接口模块以及数据安全处理程序。
在图1所示的数据安全处理设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明数据安全处理设备中的处理器1001、存储器1005可以设置在数据安全处理设备中,所述数据安全处理设备通过处理器1001调用存储器1005中存储的数据安全处理程序,并执行本发明实施例提供的数据安全处理方法。
本发明实施例提供了一种数据安全处理方法,参照图2,图2为本发明数据安全处理方法第一实施例的流程示意图。
本实施例中,所述数据安全处理方法包括以下步骤:
步骤s10:获取业务系统中的多个元数据及各元数据对应的字段长度,并根据各元数据对应的字段长度对元数据进行分类,获得多个元数据集。
易于理解的是,本实施例的执行主体可以是具有数据处理、网络通讯和程序运行等功能的数据安全处理设备,也可以为其他具有相似功能的计算机设备,本实施例并不加以限制。本实施例中,所述数据安全处理设备可以是能够接收元数据,并对元数据进行分类和脱敏处理的中央集成系统。
可以理解的是,业务系统可以为第三方系统,业务系统中的多个元数据为需要发送至中央集成系统的文字或数字等。
其中,各元数据对应的字段长度可以理解为文字或数字对应的字符长度。假设文字对应两个字符长度,数字对应一个字符长度,则“张三”的字符长度为4,“69870808998”对应的字符长度为11等。
在具体实现中,根据各元数据对应的字段长度对元数据进行分类,获得多个元数据集的步骤可以理解为,各元数据对应的字段长度可能相同,也可能不同。中央集成系统会将字段长度一致的元数据划分为一组,作为元数据集。也可以理解为,假设中央集成系统中存在姓名集和id集,则姓名集中元数据对应的字段长度可以为4-8,id集中元数据对应的字段长度可以为10-20等,获取各元数据对应的字段长度,将字段长度满足4-8的元数据划分为一组,作为姓名集,将字段长度满足10-20的元数据划分为一组,作为id集等。
进一步地,获取业务系统中的多个元数据及各元数据对应的字段长度的步骤之前,还需要获取业务系统中的多个加密数据及各加密数据对应的字段类型,之后根据字段类型从映射关系表中查找对应的解密算法,并根据解密算法对各加密数据进行解密处理,获得多个元数据及各元数据对应的字段长度。
其中,加密数据对应的字段类型可以为文字类型,也可以为数字类型等,映射关系表中存在多种类型及各类型对应的解密算法,解密算法可以为低级解密算法,也可以为高级解密算法等,假设类型为文字类型时,则文字类型对应的解密算法为低级解密算法,假设类型为数字类型时,则数字类型对应的解密算法为高级解密算法等,本实施例并不加以限制。
还需要理解的是,假设解密后的各元数据对应的字段长度为0,则判定字段长度为0对应的元数据不符合中央集成系统的存储条件,需要将字段长度为0对应的元数据自动进行阻挡等。
进一步地,根据各元数据对应的字段长度对元数据进行分类,获得多个元数据集的步骤还可以理解为获取各元数据之间的数据连接关系,并将所有的元数据按照数据连接关系构成数据血缘分析图,提取各元数据中包含的敏感数据,根据敏感数据、字段长度及数据血缘分析图分别对各元数据进行分类,获得多个元数据集,其中,中央集成系统还可以对多个元数据集设置对应的加密秘钥,当获取新的元数据时,将元数据加入对应的元数据集之前,需要根据加密秘钥对应的解密密钥进行解密授权。
数据连接关系为元数据与元数据之间的对应关系,可以理解为姓名与对应的id号具有数据连接关系等,数据血缘分析图为将具有连接关系的元数据进行直线或曲线连接,进而形成可以清晰观察数据之间的逻辑连接图。
敏感数据可以为用户自定义设置,可以将所有文字的首字作为敏感数据,也可以将所有数字的首数作为敏感数据等,本实施例并不加以限制。
在具体实现中,根据敏感数据、字段长度及数据血缘分析图分别对各元数据进行分类,获得多个元数据集的步骤,可以理解为根据数据血缘分析图观察各个元数据之间的数据连接关系,之后根据数据连接关系获取各个元数据对应的字段长度,根据字段长度对各元数据进行分类,进而确定各初始元数据集,最后通过敏感数据对初始元数据集中的元数据进行核查,判断是否分类正确,在分类正确时,将初始元数据集作为元数据集。
步骤s20:获取各元数据集对应的数据安全级别,并根据所述数据安全级别查找数据脱敏规则。
数据安全级别可以为用户自定义设置,可以为数据安全低级,也可以数据安全高级等,数据脱敏规则也可以为用户自定义设置,可以为文字随机脱敏处理,也可以为数字对半脱敏处理等,本实施例并不加以限制。
假设元数据集为姓名集时,可以从映射关系表中查找姓名集对应的数据安全级别,其中,姓名集对应的数据安全级别可以为数据安全低级,在映射关系表中查找数据安全低级对应的数据脱敏规则等。其中,映射关系表中数据安全级别与数据脱敏规则为一一对应的关系。
在具体实现中,获取各元数据集对应的数据安全级别的步骤,可以为从元数据集中随机选取多个元数据,并将多个元数据输入至预设安全等级模型中,以获得多个元数据对应的安全等级值,判断安全等级值处于预设低级等级阈值范围内,还是处于预设高级等级阈值范围内,根据判断结果确定元数据对应的数据安全等级,并将元数据对应的数据安全等级作为元数据集对应的数据安全等级。
其中,预设低级等级阈值范围和预设高级等级阈值范围都可以用户自定义设置,预设低级等级阈值范围可以为0-60%,预设高级等级阈值范围可以为61-100%等,本实施例并不加以限制。
预设安全等级模型可将多个样本元数据和样本元数据对应的标准安全等级值输入以下任一机器学习方法训练获得:支持向量机(svm)、逻辑回归算法、决策树、卷积神经网络、贝叶斯方法等,本实施例并不加以限制。
假设从元数据集中随机选取多个元数据,并将多个元数据输入至预设安全等级模型中,以获得多个元数据对应的安全等级值40%,判定安全等级值40%处于预设低级等级阈值范围0-60%内,该元数据对应的数据安全等级为数据安全低级,并将元数据对应的数据安全低级作为元数据集对应的数据安全等级,并获取数据安全低级对应的数据脱敏规则。
步骤s30:根据所述数据脱敏规则对所述数据安全级别对应元数据集中的所有元数据进行脱敏处理,以获得多个目标安全数据。
其中,目标安全数据为脱敏后的元数据。
假设元数据集中对应的安全数据等级为安全数据低级,安全数据低级对应的数据脱敏规则为首字脱敏,之后将该元数据集中的所有元数据全都进行首字脱敏,并将脱敏后的元数据作为目标安全数据,也就是说,假设元数据集中对应的元数据分别为“张三”、“李四”和“王二”,元数据集对应的安全数据等级为安全数据低级,在安全数据低级对应的数据脱敏规则为首字脱敏时,将“张三”、“李四”和“王二”进行首字脱敏,获得目标安全数据为“*三”、“*四”和“*二”等,本实施例并不加以限制。
进一步地,根据数据脱敏规则对数据安全级别对应元数据集中的所有元数据进行脱敏处理,以获得多个目标安全数据的步骤之后,还可以根据数据血缘分析图对所有的目标安全数据进行渲染处理,获得敏感数据分布图,统计所有的目标安全数据总数量,并根据目标安全数据总数量确定预设划分规则,根据预设划分规则对敏感数据分布图进行分割处理,以获得多个敏感区域分布图,分别对敏感区域分布图中的各目标安全数据进行数据安全风险评估。
其中,根据数据血缘分析图对所有的目标安全数据进行渲染处理,获得敏感数据分布图的步骤可以理解为,数据血缘分析图中存在多个目标安全数据,之后对多个目标安全数据进行颜色渲染,以进行安全数据提醒,其中颜色渲染可以为黄色渲染,也可以为红色渲染等,之后将颜色渲染后的图作为敏感数据分布图。
目标安全数据总数量为脱敏后的元数据总数量,可以为600,也可以为700等,本实施例并不加以限制。
预设划分规则可以为用户自定义设置,可以为根据元数据总数量平均划分,也可以根据血缘分析图及元数据总数量进行随机区域划分等,假设敏感数据分布图中的目标元数据总数量为600时,可以将600划分为3份敏感区域分布图,其中每份200,之后分别对敏感区域分布图中的200个目标安全数据进行数据安全风险评估等。
分别对敏感区域分布图中的各目标安全数据进行数据安全风险评估的步骤可以为分别获取各敏感区域分布图对应的安全等级警示颜色,在安全等级警示颜色为预设高危险警示颜色时,获取预设高危险警示颜色对应的目标敏感区域分布图,将目标敏感区域分布图输入至预设敏感分析模型中,以获得目标敏感区域分布图对应的敏感数据占比值,判断敏感数据占比值大于或等于预设敏感数据占比阈值,在敏感数据占比值大于或等于预设敏感数据占比阈值时,获取目标敏感区域分布图包含的目标安全数据,并对目标安全数据进行数据安全分析评估。
安全等级警示颜色与预设高危险警示颜色都可以为用户自定义设置,可以为红色,也可以为蓝色等,本实施例并不加以限制。
假设各敏感区域分布图中的目标安全数据都具有对应的颜色标识,其中颜色标识可以为相同,也可以为不同,将目标敏感区域分布图中的所有颜色进行融合处理,获得目标数据警示颜色,并将目标数据警示颜色作为安全等级警示颜色,若安全等级警示颜色为红色,预设高危险警示颜色为红色,则将该安全等级警示颜色对应的目标敏感区域分布图输入至预设敏感分析模型中,以获得目标敏感区域分布图中对应的敏感数据占比值,假设敏感数据占比值为80%时,预设敏感数据占比值为70%,敏感数据占比值大于预设敏感数据占比阈值,则获取目标敏感区域分布图中的所有目标安全数据,并对目标安全数据进行数据安全分析评估等。
进一步地,对各目标安全数据进行数据安全分析评估的步骤之后,还需要分别将各目标安全数据输入至预设数据安全风险评估模型中,以获得各目标安全数据对应的数据安全风险评估值,判断数据安全风险评估值是否大于或等于预设风险评估阈值,在数据安全风险评估值大于或等于预设风险评估阈值时,对目标安全数据进行销毁处理。
预设数据安全风险评估模型为多个样本安全数据及各样本安全数据对应的标准安全风险评估值对卷积神经网络进行训练,进而构建的数据安全风险评估模型,其中,预设风险评估阈值为用户自定义设置,可以为70%,也可以为80%等,本实施例并不加以限制。
假设目标安全数据对应的数据安全风险评估值为80%,预设风险评估阈值70%,数据安全风险评估值大于预设风险评估阈值,则将目标安全数据进行销毁处理等。
本实施例中,首先获取业务系统中的多个元数据及各元数据对应的字段长度,并根据各元数据对应的字段长度对元数据进行分类,获得多个元数据集,然后获取各元数据集对应的数据安全级别,并根据数据安全级别查找数据脱敏规则,最后根据数据脱敏规则对数据安全级别对应元数据集中的所有元数据进行脱敏处理,以获得多个目标安全数据。相较于现有技术,需要对数据进行主动防护,但这样会降低数据的处理效率,而本实施例中根据元数据对应的数据安全级别确定数据脱敏规则,从而根据数据脱敏规则对元数据进行脱敏处理,实现了在保证数据安全性的同时,从而提高了元数据的处理效率。
参考图3,图3为本发明数据安全处理方法第二实施例的流程示意图。
基于上述第一实施例,在本实施例中,所述步骤s10,还包括:
步骤s101:获取业务系统中的多个元数据及各元数据对应的字段长度,获取各元数据之间的数据连接关系,并将所有的元数据按照所述数据连接关系构成数据血缘分析图。
可以理解的是,业务系统可以为第三方系统,业务系统中的多个元数据为需要发送至中央集成系统的文字或数字等。
其中,各元数据对应的字段长度可以理解为文字或数字对应的字符长度。假设文字对应两个字符长度,数字对应一个字符长度,则“张三”的字符长度为4,“69870808998”对应的字符长度为11等。
数据连接关系可以理解为元数据与元数据之间存在连接关系,例如姓名和该姓名对应的id号就存在连接关系等,本实施例并不加以限制。
在具体实现中,为了便于观察元数据与元数据之间的逻辑关系,可以获取各元数据之间的数据连接关系,其中,多个元数据与对应的元数据之间都可能存在连接关系,之后可将存在连接关系的元数据直线或曲线连接,进而将连接后的元数据及连接线构成数据血缘分析图。
步骤s102:提取各元数据中包含的敏感数据。
可理解的是,提取各元数据中包含的敏感数据的步骤可以为分别将各元数据输入至预设敏感识别模型中,以获得各元数据对应的敏感识别度及敏感识别度对应的敏感识别类型,根据敏感识别度和敏感识别类型确定各元数据对应的敏感数据。
其中,预设敏感识别模型为对多个样本元数据及对应的标准敏感识别类型输入至神经网络模型中训练,进而构建的敏感识别模型。敏感识别类型可以为文字类型,也可以为数字类型等,本实施并不加以限制。
假设将某一个元数据输入至预设敏感识别模型中,获得元数据对应的敏感识别度为80%,其敏感识别度类型输出为文字类型,预设敏感识别度为70%,元数据对应的敏感识别度大于预设敏感识别度,则将敏感识别度类型-文字类型作为该元数据的敏感识别类型,根据敏感识别类型从敏感映射关系表中查找对应的敏感规则,根据敏感规则确定元数据的敏感数据,其中,敏感规则可以为用户自定义设置,如文字类型,对应的敏感规则为该元数据的首字,数字类型,对应的敏感规则可以为该元数据的尾值等,本实施例并不加以限制。
步骤s103:根据所述敏感数据、所述字段长度及所述数据血缘分析图分别对各元数据进行分类,获得多个元数据集。
在具体实现中,根据敏感数据、字段长度及数据血缘分析图分别对各元数据进行分类,获得多个元数据集的步骤,可以理解为根据数据血缘分析图观察各个元数据之间的数据连接关系,之后根据数据连接关系获取各个元数据对应的字段长度,根据字段长度对各元数据进行分类,进而确定各初始元数据集,最后通过敏感数据对初始元数据集中的元数据进行核查,判断是否分类正确,在分类正确时,将初始元数据集作为元数据集。
本实施例中,首先获取各元数据之间的数据连接关系,并将所有的元数据按照数据连接关系构成数据血缘分析图,之后提取各元数据中包含的敏感数据,并根据敏感数据、字段长度及数据血缘分析图分别对各元数据进行分类,获得多个元数据集,现有技术中需要用户在输入元数据时进行主动归类,但这样会降低元数据的分类效率,而本实施例中根据敏感数据、字段长度及数据血缘分析图对各元数据进行分类,实现了在保证元数据分类正确率的同时,提高元数据的分类效率。
参照图4,图4为本发明数据安全处理装置第一实施例的结构框图。
如图4所示,本发明实施例提出的数据安全处理装置包括:
获取模块4001,用于获取业务系统中的多个元数据及各元数据对应的字段长度,并根据各元数据对应的字段长度对元数据进行分类,获得多个元数据集;
查找模块4002,用于获取各元数据集对应的数据安全级别,并根据所述数据安全级别查找数据脱敏规则;
处理模块4003,用于根据所述数据脱敏规则对所述数据安全级别对应元数据集中的所有元数据进行脱敏处理,以获得多个目标安全数据。
本实施例中,首先获取业务系统中的多个元数据及各元数据对应的字段长度,并根据各元数据对应的字段长度对元数据进行分类,获得多个元数据集,然后获取各元数据集对应的数据安全级别,并根据数据安全级别查找数据脱敏规则,最后根据数据脱敏规则对数据安全级别对应元数据集中的所有元数据进行脱敏处理,以获得多个目标安全数据。相较于现有技术,需要对数据进行主动防护,但这样会降低数据的处理效率,而本实施例中根据元数据对应的数据安全级别确定数据脱敏规则,从而根据数据脱敏规则对元数据进行脱敏处理,实现了在保证数据安全性的同时,从而提高了元数据的处理效率。
进一步地,所述获取模块4001,还用于获取业务系统中的多个加密数据及各加密数据对应的字段类型;
所述获取模块4001,还用于根据所述字段类型从映射关系表中查找各加密数据对应的解密算法;
所述获取模块4001,还用于根据所述解密算法对各加密数据进行解密处理,获得多个元数据及各元数据对应的字段长度。
进一步地,所述获取模块4001,还用于获取各元数据之间的数据连接关系,并将所有的元数据按照所述数据连接关系构成数据血缘分析图;
所述获取模块4001,还用于提取各元数据中包含的敏感数据;
所述获取模块4001,还用于根据所述敏感数据、所述字段长度及所述数据血缘分析图分别对各元数据进行分类,获得多个元数据集。
进一步地,所述获取模块4001,还用于分别将各元数据输入至预设敏感识别模型中,以获得各元数据对应的敏感识别度及所述敏感识别度对应的敏感识别类型;
所述获取模块4001,还用于根据所述敏感识别度和所述敏感识别类型确定各元数据对应的敏感数据。
进一步地,所述处理模块4003,还用于根据所述数据血缘分析图对所有的目标安全数据进行渲染处理,获得敏感数据分布图;
所述处理模块4003,还用于统计所有的目标安全数据总数量,并根据所述目标安全数据总数量确定预设划分规则;
所述处理模块4003,还用于根据所述预设划分规则对所述敏感数据分布图进行分割处理,以获得多个敏感区域分布图;
所述处理模块4003,还用于分别对所述敏感区域分布图中的各目标安全数据进行数据安全风险评估。
进一步地,所述处理模块4003,还用于分别获取各敏感区域分布图对应的安全等级警示颜色;
所述处理模块4003,还用于在所述安全等级警示颜色为预设高危险警示颜色时,获取所述预设高危险警示颜色对应的目标敏感区域分布图;
所述处理模块4003,还用于将所述目标敏感区域分布图输入至预设敏感分析模型中,以获得所述目标敏感区域分布图对应的敏感数据占比值;
所述处理模块4003,还用于判断所述敏感数据占比值大于或等于预设敏感数据占比阈值;
所述处理模块4003,还用于在所述敏感数据占比值大于或等于所述预设敏感数据占比阈值时,获取所述目标敏感区域分布图包含的目标安全数据,并对各目标安全数据进行数据安全分析评估。
进一步地,所述处理模块4003,还用于分别将各目标安全数据输入至预设数据安全风险评估模型中,以获得各目标安全数据对应的数据安全风险评估值;
所述处理模块4003,还用于判断所述数据安全风险评估值是否大于或等于预设风险评估阈值;
所述处理模块4003,还用于在所述数据安全风险评估值大于或等于所述预设风险评估阈值时,对所述目标安全数据进行销毁处理。
本发明数据安全处理装置的其他实施例或具体实现方式可参照上述各方法实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器/随机存取存储器、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
1.一种数据安全处理方法,其特征在于,所述数据安全处理方法包括:
获取业务系统中的多个元数据及各元数据对应的字段长度,并根据各元数据对应的字段长度对元数据进行分类,获得多个元数据集;
获取各元数据集对应的数据安全级别,并根据所述数据安全级别查找数据脱敏规则;
根据所述数据脱敏规则对所述数据安全级别对应元数据集中的所有元数据进行脱敏处理,以获得多个目标安全数据。
2.如权利要求1的方法,其特征在于,所述获取业务系统中的多个元数据及各元数据对应的字段长度的步骤,包括:
获取业务系统中的多个加密数据及各加密数据对应的字段类型;
根据所述字段类型从映射关系表中查找各加密数据对应的解密算法;
根据所述解密算法对各加密数据进行解密处理,获得多个元数据及各元数据对应的字段长度。
3.如权利要求1所述的方法,其特征在于,所述根据各元数据对应的字段长度对元数据进行分类,获得多个元数据集的步骤,包括:
获取各元数据之间的数据连接关系,并将所有的元数据按照所述数据连接关系构成数据血缘分析图;
提取各元数据中包含的敏感数据;
根据所述敏感数据、所述字段长度及所述数据血缘分析图分别对各元数据进行分类,获得多个元数据集。
4.如权利要求3所述的方法,其特征在于,所述提取各元数据中包含的敏感数据的步骤,包括:
分别将各元数据输入至预设敏感识别模型中,以获得各元数据对应的敏感识别度及所述敏感识别度对应的敏感识别类型;
根据所述敏感识别度和所述敏感识别类型确定各元数据对应的敏感数据。
5.如权利要求4所述的方法,其特征在于,所述根据所述数据脱敏规则对所述数据安全级别对应元数据集中的所有元数据进行脱敏处理,以获得多个目标安全数据的步骤之后,还包括:
根据所述数据血缘分析图对所有的目标安全数据进行渲染处理,获得敏感数据分布图;
统计所有的目标安全数据总数量,并根据所述目标安全数据总数量确定预设划分规则;
根据所述预设划分规则对所述敏感数据分布图进行分割处理,以获得多个敏感区域分布图;
分别对所述敏感区域分布图中的各目标安全数据进行数据安全风险评估。
6.如权利要求5所述的方法,其特征在于,所述分别对所述敏感区域分布图中的各目标安全数据进行数据安全风险评估的步骤,包括:
分别获取各敏感区域分布图对应的安全等级警示颜色;
在所述安全等级警示颜色为预设高危险警示颜色时,获取所述预设高危险警示颜色对应的目标敏感区域分布图;
将所述目标敏感区域分布图输入至预设敏感分析模型中,以获得所述目标敏感区域分布图对应的敏感数据占比值;
判断所述敏感数据占比值大于或等于预设敏感数据占比阈值;
在所述敏感数据占比值大于或等于所述预设敏感数据占比阈值时,获取所述目标敏感区域分布图包含的目标安全数据,并对各目标安全数据进行数据安全分析评估。
7.如权利要求6所述的方法,其特征在于,所述对各目标安全数据进行数据安全分析评估的步骤之后,还包括:
分别将各目标安全数据输入至预设数据安全风险评估模型中,以获得各目标安全数据对应的数据安全风险评估值;
判断所述数据安全风险评估值是否大于或等于预设风险评估阈值;
在所述数据安全风险评估值大于或等于所述预设风险评估阈值时,对所述目标安全数据进行销毁处理。
8.一种数据安全处理装置,其特征在于,所述数据安全处理包括:
获取模块,用于获取业务系统中的多个元数据及各元数据对应的字段长度,并根据各元数据对应的字段长度对元数据进行分类,获得多个元数据集;
查找模块,用于获取各元数据集对应的数据安全级别,并根据所述数据安全级别查找数据脱敏规则;
处理模块,用于根据所述数据脱敏规则对所述数据安全级别对应元数据集中的所有元数据进行脱敏处理,以获得多个目标安全数据。
9.一种数据安全处理设备,其特征在于,所述数据安全处理设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据安全处理程序,所述数据安全处理程序被所述处理器执行时实现如权利要求1至7中任一项所述的数据安全处理方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有数据安全处理程序,所述数据安全处理程序被处理器执行时实现如权利要求1至7中任一项所述的数据安全处理方法的步骤。
技术总结