本技术涉及金融领域,具体而言,涉及一种产品购买概率的确定方法、产品购买概率的确定装置、计算机可读存储介质以及电子装置。
背景技术:
1、随着金融科技的发展,可以通过使用机器学习算法分析海量客户的历史记录及个人信息,可以预测出某用户可能接受某类贷款产品的概率,并优先选择接受概率较高的用户进行营销,大幅提升工作人员的工作效率和效益。
2、然而,由于模型的训练数据中销售成功的次数远少于销售失败的次数,即存在数据不平衡现象,甚至,销售成功的次数是失败次数的百分之一,这种不平衡数据会导致预测模型的预测结果倾向于多数类,即销售失败,而无法准确预测少数类,即销售成功。因此,亟需一种方法可以解决概率预测模型的训练数据中的不平衡现象。
技术实现思路
1、本技术的主要目的在于提供一种产品购买概率的确定方法、产品购买概率的确定装置、计算机可读存储介质以及电子装置,以至少解决现有技术中概率预测模型的训练数据中的不平衡现象。
2、根据本技术的一方面,提供了一种产品购买概率的确定方法,包括:获取目标历史销售数据和目标生成网络,并将所述目标历史销售数据输入至所述目标生成网络中进行处理,得到目标样本数据,其中,所述目标历史销售数据为当前时刻之前用户的销售数据,所述销售数据至少用于表征所述用户是否购买产品,所述目标生成网络包括生成器、与所述生成器的输出端连接的第一鉴别器、与所述生成器的输出端连接的第二鉴别器以及与所述生成器的输出端连接的分类器,所述第一鉴别器用于鉴别所述生成器的输出数据是否符合所述目标历史销售数据的数据分布,所述第二鉴别器用于鉴别所述生成器的输出数据是否符合所述生成器的数据分布,所述分类器用于学习所述目标历史销售数据的分类,所述目标样本数据为均衡样本数据;获取概率预测模型,其中,所述概率预测模型为使用多组历史数据通过机器学习训练出的,多组所述历史数据中的每组数据均包括:所述目标样本数据和所述目标样本数据对应的购买概率;获取待预测用户数据,并将所述待预测用户数据输入至所述概率预测模型,得到所述待预测用户数据对应的购买概率,所述待预测用户数据为所述当前时刻未购买所述产品的待预测用户的销售数据,所述购买概率为所述待预测用户购买所述产品的概率。
3、可选地,获取目标历史销售数据,包括:获取历史销售数据,其中,所述历史销售数据至少包括所述当前时刻之前所述用户是否购买所述产品、所述产品的销售时长、所述用户的浏览记录以及所述用户的身份信息;对所述历史销售数据进行数据预处理,得到所述目标历史销售数据,其中,所述预处理包括数据转换、数据清洗、数据映射以及数据标准化中的至少一种。
4、可选地,所述目标历史销售数据包括正样本数据和负样本数据,所述正样本数据为所述用户已购买所述产品对应的所述目标历史销售数据,所述负样本数据为所述用户未购买所述产品对应的所述目标历史销售数据,获取所述目标生成网络,包括:获取步骤,获取初始双鉴别器生成对抗网络,其中,所述初始双鉴别器生成对抗网络包括初始生成器、与所述初始生成器的输出端连接的第一初始鉴别器、与所述初始生成器的输出端连接的第二初始鉴别器以及与所述初始生成器的输出端连接的初始分类器,所述初始生成器的参数被配置为第一初始参数,所述第一初始鉴别器的参数被配置为第二初始参数,所述第二初始鉴别器的参数被配置为第三初始参数,所述初始分类器的参数被配置为第四初始参数;输入步骤,获取随机噪声数据,并将所述随机噪声数据输入至所述初始生成器,得到模拟数据;第一计算步骤,将所述目标历史销售数据和所述模拟数据输入至所述初始分类器,计算所述初始分类器的第一目标函数,并对所述第四初始参数进行更新,以最小化所述第一目标函数;第二计算步骤,将所述模拟数据和所述正样本数据输入至所述第一初始鉴别器,计算所述第一初始鉴别器的第二目标函数,并对所述第二初始参数进行更新,以最小化所述第二目标函数;第三计算步骤,将所述模拟数据和所述正样本数据输入至所述第二初始鉴别器,计算所述第二初始鉴别器的第三目标函数,并对所述第三初始参数进行更新,以最小化所述第三目标函数;第四计算步骤,将所述随机噪声数据输入至所述初始生成器,计算所述初始生成器的第四目标函数,并对所述第一初始参数进行更新,以最小化所述第四目标函数;依次重复所述输入步骤、所述第一计算步骤、所述第二计算步骤、所述第三计算步骤以及所述第四计算步骤至少一次,直到达到预设条件,确定达到所述预设条件时对应的所述初始生成器、所述第一初始鉴别器、所述第二初始鉴别器以及所述初始分类器为所述目标生成网络。
5、可选地,计算所述第一目标函数包括:根据公式
6、以及计算所述第一目标函数其中,c1(x)为输出所述负样本数据的概率,c2(x)为输出所述正样本数据的概率,c3(x)为输出所述模拟数据的概率;计算所述第二目标函数包括:根据公式:计算所述第二目标函数α为所述第二初始参数,g(z)为所述模拟数据;计算所述第三目标函数包括:根据公式计算所述第二目标函数其中,β为所述第三初始参数;计算所述第四目标函数包括:根据公式计算所述第四目标函数其中,l(d1,d1)为所述第一初始参数。
7、可选地,将所述目标历史销售数据输入至所述目标生成网络中进行处理,得到目标样本数据,包括:将所述目标历史销售数据输入至所述目标生成网络中,得到处理后数据;确定所述处理后数据与所述目标历史销售数据的并集为所述目标样本数据。
8、可选地,所述概率预测模型包括逻辑回归模型和轻量级梯度提升框架模型,将所述待预测用户数据输入至所述概率预测模型,得到所述待预测用户数据对应的购买概率,包括:将所述待预测用户数据输入至所述逻辑回归模型,得到第一预测值,其中,所述逻辑回归模型为使用多组所述历史数据通过机器学习训练出的;将所述待预测用户数据输入至所述轻量级梯度提升框架模型,得到第二预测值,其中,所述逻辑回归模型为使用多组所述历史数据通过机器学习训练出的;计算所述第一预测值和所述第二预测值的平均值,得到所述购买概率。
9、可选地,将所述待预测用户数据输入至所述概率预测模型,得到所述待预测用户数据对应的购买概率之后,所述方法还包括:在所述购买概率大于概率阈值的情况下,向所述用户推荐所述产品。
10、根据本技术的另一方面,提供了一种产品购买概率的确定装置,包括:第一获取单元,用于获取目标历史销售数据和目标生成网络,并将所述目标历史销售数据输入至所述目标生成网络中进行处理,得到目标样本数据,其中,所述目标历史销售数据为当前时刻之前用户的销售数据,所述销售数据至少用于表征所述用户是否购买产品,所述目标生成网络包括生成器、与所述生成器的输出端连接的第一鉴别器、与所述生成器的输出端连接的第二鉴别器以及与所述生成器的输出端连接的分类器,所述第一鉴别器用于鉴别所述生成器的输出数据是否符合所述目标历史销售数据的数据分布,所述第二鉴别器用于鉴别所述生成器的输出数据是否符合所述生成器的数据分布,所述分类器用于学习所述目标历史销售数据的分类,所述目标样本数据为均衡样本数据;第二获取单元,用于获取概率预测模型,其中,所述概率预测模型为使用多组历史数据通过机器学习训练出的,多组所述历史数据中的每组数据均包括:所述目标样本数据和所述目标样本数据对应的购买概率;输入单元,用于获取待预测用户数据,并将所述待预测用户数据输入至所述概率预测模型,得到所述待预测用户数据对应的购买概率,所述待预测用户数据为所述当前时刻未购买所述产品的待预测用户的销售数据,所述购买概率为所述待预测用户购买所述产品的概率。
11、根据本技术的再一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行任意一种所述的方法。
12、根据本技术的又一方面,提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行任意一种所述的方法。
13、应用本技术的技术方案,首先,获取目标历史销售数据和目标生成网络,并将目标历史销售数据输入至目标生成网络中进行处理,得到目标样本数据,目标历史销售数据为当前时刻之前用户的销售数据,销售数据至少用于表征用户是否购买产品,目标生成网络包括生成器、与生成器的输出端连接的第一鉴别器、与生成器的输出端连接的第二鉴别器以及与生成器的输出端连接的分类器,第一鉴别器用于鉴别生成器的输出数据是否符合目标历史销售数据的数据分布,第二鉴别器用于鉴别生成器的输出数据是否符合生成器的数据分布,分类器用于学习目标历史销售数据的分类,目标样本数据为均衡样本数据;然后,获取概率预测模型,概率预测模型为使用多组历史数据通过机器学习训练出的,多组历史数据中的每组数据均包括:目标样本数据和目标样本数据对应的购买概率;最后,获取待预测用户数据,并将待预测用户数据输入至概率预测模型,得到待预测用户数据对应的购买概率,待预测用户数据为当前时刻未购买产品的待预测用户的销售数据,购买概率为待预测用户购买产品的概率。由于预测模型的训练数据中销售成功的历史数据远远小于销售失败的历史数据,导致销售数据预测不准确,上述方法通过在预测之前将历史销售数据预先输入目标生成网络进行处理,第一鉴别器用于鉴别生成器的输出数据是否符合目标历史销售数据的数据分布,第二鉴别器用于鉴别生成器的输出数据是否符合生成器的数据分布,分类器用于学习目标历史销售数据的分类,进而得到均衡样本,使营销成功的历史数据约等于营销失败的历史数据,解决了概率预测模型的训练数据中的不平衡现象。
1.一种产品购买概率的确定方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,获取目标历史销售数据,包括:
3.根据权利要求1所述的方法,其特征在于,所述目标历史销售数据包括正样本数据和负样本数据,所述正样本数据为所述用户已购买所述产品对应的所述目标历史销售数据,所述负样本数据为所述用户未购买所述产品对应的所述目标历史销售数据,获取所述目标生成网络,包括:
4.根据权利要求3所述的方法,其特征在于,
5.根据权利要求1所述的方法,其特征在于,将所述目标历史销售数据输入至所述目标生成网络中进行处理,得到目标样本数据,包括:
6.根据权利要求1所述的方法,其特征在于,所述概率预测模型包括逻辑回归模型和轻量级梯度提升框架模型,将所述待预测用户数据输入至所述概率预测模型,得到所述待预测用户数据对应的购买概率,包括:
7.根据权利要求1所述的方法,其特征在于,将所述待预测用户数据输入至所述概率预测模型,得到所述待预测用户数据对应的购买概率之后,所述方法还包括:
8.一种产品购买概率的确定装置,其特征在于,包括:
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至7中任意一项所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行权利要求1至7中任意一项所述的方法。
