本申请属于数据处理领域,尤其涉及一种测试数据生成方法、装置、设备及存储介质。
背景技术:
1、在对业务系统进行建设的过程中,需要对业务系统中的业务进行长期的测试。测试需要测试数据,但基于对真实的业务数据的安全保护,能够用作测试数据的真实的业务数据数量有限,且还需对业务数据中的敏感信息进行脱敏处理,导致测试数据的质量较低。为了提高测试数据的质量,可基于真实的业务数据通过合成手段合成数据,将合成的数据作为测试数据使用。但目前得到的合成数据只能体现真实的业务数据中出现频率高的业务数据的特性,使得测试数据的覆盖度较低,利用该测试数据进行的测试的覆盖度也较低。
技术实现思路
1、本申请实施例提供一种测试数据生成方法、装置、设备及存储介质,能够提高测试数据的覆盖度。
2、第一方面,本申请实施例提供一种测试数据生成方法,包括:根据测试数据模型信息,初始化生成对抗网络,生成对抗网络包括生成器和判别器,判别器包括预先根据元素符合业务技术逻辑要求的训练数据训练得到的判别神经网络;基于获取的真实业务数据和生成器生成的合成数据,对生成对抗网络进行迭代训练,直至生成对抗网络满足第一训练截止条件,在每次迭代训练中,判别器将综合评分最高的组合域数据对应的梯度数据传递给生成器,组合域数据根据真实业务数据和合成数据得到,综合评分表征组合域数据与真实业务数据的关联性以及组合域数据与业务技术逻辑要求的符合程度;将满足第一训练截止条件的生成对抗网络中的生成器确定为测试数据生成器,并利用测试数据生成器生成测试数据。
3、第二方面,本申请实施例提供一种测试数据生成装置,包括:初始化模块,用于根据测试数据模型信息,初始化生成对抗网络,生成对抗网络包括生成器和判别器,判别器包括预先根据元素符合业务技术逻辑要求的训练数据训练得到的判别神经网络;训练模块,用于基于获取的真实业务数据和生成器生成的合成数据,对生成对抗网络进行迭代训练,直至生成对抗网络满足第一训练截止条件,在每次迭代训练中,判别器将综合评分最高的组合域数据对应的梯度数据传递给生成器,组合域数据根据真实业务数据和合成数据得到,综合评分表征组合域数据与真实业务数据的关联性以及组合域数据与业务技术逻辑要求的符合程度;数据生成模块,用于将满足第一训练截止条件的生成对抗网络中的生成器确定为测试数据生成器,并利用测试数据生成器生成测试数据。
4、第三方面,本申请实施例提供一种电子设备,包括:处理器以及存储有计算机程序指令的存储器;处理器执行计算机程序指令时实现第一方面的测试数据生成方法。
5、第四方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现第一方面的测试数据生成方法。
6、本申请实施例提供一种测试数据生成方法、装置、设备及存储介质,根据测试数据模型,初始化包括生成器和判别器的生成对抗网络,基于真实业务数据和生成器生成的合成数据,对生成对抗网络进行迭代训练。每次迭代训练中,判别器将能够表征与真实业务数据的关联性以及与业务技术逻辑要求的负荷程度的综合分数最高的组合域数据对应的梯度数据传递给生成器,以使生成器根据该梯度数据生成新的合成数据。生成器生成的合成数据具有随机分散性,判别器包括预先根据元素符合业务技术逻辑要求的训练数据训练得到的判别神经网络,判别神经网络可对生成器进行合成数据在业务技术逻辑要求上的约束,从而降低生成器生成的合成数据向不符合业务技术逻辑要求的方向分散的可能性,使得生成器生成的合成数据在符合业务技术逻辑要求的基础上具有分散性。满足训练截止条件的生成对抗网络中的生成器作为测试数据生成器所生成的测试数据的类型更加丰富,既包括能够体现出现频率高的真实业务数据特性的数据,也包括能够体现出现频率低的真实业务数据特性的数据,提高了测试数据的覆盖度。
1.一种测试数据生成方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于获取的真实业务数据和所述生成器生成的合成数据,对所述生成对抗网络进行迭代训练,包括:
3.根据权利要求2所述的方法,其特征在于,所述将所述组合域数据输入所述判别神经网络,得到第一重构数据,包括:
4.根据权利要求2所述的方法,其特征在于,所述通过所述判别器基于所述组合域数据和所述第一重构数据,得到所述综合评分,包括:
5.根据权利要求2所述的方法,其特征在于,所述利用所述综合评分最高的所述组合域数据对应的梯度数据对所述生成器和所述判别器进行迭代训练,包括:
6.根据权利要求1所述的方法,其特征在于,在所述根据测试数据模型信息,初始化生成对抗网络之前,还包括:
7.根据权利要求6所述的方法,其特征在于,所述通过所述神经网络模型对所述训练数据进行重构处理,得到第二重构数据,包括:
8.一种测试数据生成装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括:处理器以及存储有计算机程序指令的存储器;
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1至7中任意一项所述的测试数据生成方法。