一种在用户冷启动场景下的险种推荐方法及相关设备与流程

    专利2022-07-08  108


    本说明书一个或多个实施例涉及数据处理技术领域,尤其涉及一种在用户冷启动场景下的险种推荐方法及相关设备。



    背景技术:

    对于产品推荐系统,每天都有大量的新用户访问系统,如果推荐系统能够为新用户推荐比较喜欢的商品,推荐系统会赢得更多用户的信任,提高用户对系统的忠诚度,对用户来说,也可以随时得到高质量的个性化服务。

    现有的产品推荐系统,多数基于协同过滤的思想,但是冷启动问题是协同过滤推荐算法中被广泛关注的一个经典问题,该问题一直影响传统协同过滤推荐系统的健康发展,它的存在严重影响了推荐系统的推荐质量。在用户冷启动场景下的推荐通常是指针对新用户的推荐,由于新用户被公司掌握的特征信息少,且无历史选择记录,因此较难采用已有推荐算法技术进行有针对性的推荐。

    目前针对冷启动问题提出的解决方法,是定期将用户注册信息数据库按照每个特征统计物品频次统计表,向用户传递每个特征(假设有m个特征)发生频次最高的top-n物品列表,将m*n个物品记录进行聚合,形成t行<物品,累计占比值>记录,最后,将t行记录按累计占比值最大值排序,优先推荐前n个物品。

    现有的推荐方法容易偏向于热门物品推荐,所以推荐效果准确性差、推荐物品覆盖率低,无法降低物品长尾效应;且需要频繁且定期进行大规模频率统计,需要较大资源消耗。



    技术实现要素:

    有鉴于此,本说明书一个或多个实施例的目的在于提出一种在用户冷启动场景下的险种推荐方法及相关设备,以解决现有技术对新用户进行产品推荐时准确性较差的问题。

    基于上述目的,本说明书一个或多个实施例提供了一种在用户冷启动场景下的险种推荐方法,包括:

    获取目标用户的注册信息;

    根据所述注册信息,通过预先构建的用户集合确定模型,确定所述目标用户对应的用户集合;

    在所述用户集合中,通过预先构建的相似用户确定模型,确定所述目标用户的相似用户;

    根据所述相似用户选择的险种,确定所述目标用户的推荐险种。

    可选的,还包括:

    构建包括若干第一样本的第一样本集;其中所述第一样本包括:第一样本数据和第一标签数据;所述第一样本数据包括历史用户的注册信息和险种选择信息;所述第一标签数据包括所述历史用户对应的用户集合;

    根据所述第一样本集,通过预定的第一机器学习算法,构建并训练得到所述用户集合确定模型。

    可选的,还包括:

    构建包括若干第二样本的第二样本集;其中所述第二样本包括:第二样本数据和第二标签数据;所述第二样本数据包括所述历史用户的注册信息、险种选择信息和所述历史用户对应的用户集合;所述第二标签数据包括所述历史用户的相似用户;

    根据所述第二样本集,通过预定的第二机器学习算法,构建并训练得到所述相似用户确定模型。

    可选的,所述根据所述第二样本集,通过预定的第二机器学习算法,构建并训练得到所述相似用户确定模型,包括:

    将所述用户集合中的历史用户的注册信息的特征分为离散型特征和连续型特征;

    利用汉明距离n_unequal(x,y)计算所述离散型特征的相似度和利用曼哈顿距离sum(|x-y|)计算所述连续型特征的相似度,则计算用户相似度的公式为:n_unequal(x,y)*kl sum(|x-y|)*kx;其中,kl为离散型特征权重向量,kx为连续型特征权重向量;

    构造目标函数p=f(kl,kx);其中,p为推荐准确率;

    利用tree-structuredparzenestimator算法,迭代计算得到所述目标函数p=f(kl,kx)的最优解kl和kx,使得p的值最大;

    将所述最优解kl和kx带入n_unequal(x,y)*kl sum(|x-y|)*kx,构建所述相似用户确定模型。

    可选的,所述构造目标函数p=f(kl,kx),包括:

    初始化kl和kx,根据所述计算用户相似度的公式n_unequal(x,y)*kl sum(|x-y|)*kx,确定所述历史用户的相似用户;

    根据所述历史用户的相似用户选择的险种,确定所述历史用户的推荐险种;

    计算所述历史用户的推荐险种命中所述历史用户的选择险种的次数,作为命中数;

    根据所述命中数和推荐次数,得到推荐准确率p。

    可选的,所述利用tree-structuredparzenestimator算法,迭代计算得到所述目标函数p=f(kl,kx)的最优解kl和kx,使得p的值最大,包括:

    初始化权重向量(kl,kx)为k0;

    将k0带入所述目标函数p=f(kl,kx),得到p值p0,利用(k0,p0)表示第一次获得向量;

    将所述第一次获得向量{(k0,p0)}带入tree-structuredparzenestimator算法,得到权重向量k1;将k1带入所述目标函数p=f(kl,kx),得到p值p1,利用(k1,p1)表示第二次获得向量;

    将所述第一次获得向量和第二次获得向量{(k0,p0),(k1,p1)}带入tree-structuredparzenestimator算法,得到权重向量k2;将k2带入所述目标函数p=f(kl,kx),得到p值p2,利用(k2,p2)表示第三次获得向量;

    按照预设的次数迭代计算,将最大的p值对应的kl和kx作为所述目标函数p=f(kl,kx)的最优解。

    可选的,所述根据所述相似用户选择的险种,确定所述目标用户的推荐险种,包括:

    将所述相似用户选择的险种按照被选择频次从高到低的顺序进行排序,将前预设位数的险种,作为所述推荐险种。

    基于同一发明构思,本说明书一个或多个实施例提供了一种在用户冷启动场景下的险种推荐装置,包括:

    注册信息获取模块,用于获取目标用户的注册信息;

    用户集合确定模块,用于根据所述注册信息,通过预先构建的用户集合确定模型,确定所述目标用户对应的用户集合;

    相似用户确定模块,用于在所述用户集合中,通过预先构建的相似用户确定模型,确定所述目标用户的相似用户;

    推荐险种确定模块,用于根据所述相似用户选择的险种,确定所述目标用户的推荐险种。

    基于同一发明构思,本说明书一个或多个实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述的方法。

    基于同一发明构思,本说明书一个或多个实施例提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行上述方法。

    从上面所述可以看出,本说明书一个或多个实施例提供的在用户冷启动场景下的险种推荐方法,包括:获取目标用户的注册信息;根据所述注册信息,通过预先构建的用户集合确定模型,确定所述目标用户对应的用户集合;在所述用户集合中,通过预先构建的相似用户确定模型,确定所述目标用户的相似用户;根据所述相似用户选择的险种,确定所述目标用户的推荐险种。本发明通过初步确定用户集合,在用户集合中再确定相似用户的方式,提高了险种推荐的准确性,提高了险种推荐的覆盖率,降低了资源消耗。

    附图说明

    为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

    图1为本说明书一个或多个实施例提供的在用户冷启动场景下的险种推荐方法的一种流程示意图;

    图2为本说明书一个或多个实施例提供的相似用户确定模型构建方法的一种流程示意图;

    图3为本说明书一个或多个实施例提供的目标函数构造方法的一种流程示意图;

    图4为本说明书一个或多个实施例提供的最优解求解方法的一种流程示意图;

    图5为本说明书一个或多个实施例提供的在用户冷启动场景下的险种推荐装置的一种结构示意图;

    图6为本说明书一个或多个实施例提供的一种更为具体的电子设备硬件结构示意图。

    具体实施方式

    为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开进一步详细说明。

    需要说明的是,除非另外定义,本说明书一个或多个实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本说明书一个或多个实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。

    对于产品推荐系统,每天都有大量的新用户访问系统,如果推荐系统能够为新用户推荐比较喜欢的商品,推荐系统会赢得更多用户的信任,提高用户对系统的忠诚度,对用户来说,也可以随时得到高质量的个性化服务。

    现有的产品推荐系统,多基于协同过滤的思想,但是冷启动问题是协同过滤推荐算法中被广泛关注的一个经典问题,该问题一直影响传统协同过滤推荐系统的健康发展,它的存在严重影响了推荐系统的推荐质量。在用户冷启动场景下的推荐通常是指针对新用户的推荐。由于新用户被公司掌握的特征信息少,且无历史购买记录,因此较难采用已有推荐算法技术进行有针对性的推荐。

    目前针对冷启动问题提出的解决方法,是定期将用户注册信息数据库按照每个特征统计物品频次统计表,向用户传递每个特征(假设有m个特征)发生频次最高的top-n物品列表,将m*n个物品记录进行聚合,形成t行<物品,累计占比值>记录,最后,将t行记录按累计占比值最大值排序,优先推荐前n个物品。

    发明人发现采用上述技术方案,在实施过程中有如下缺点:

    推荐效果准确性差,无法提升客户满意度:上述传统推荐方法无法做到千人千面推荐,只能根据客户注册信息时所在的特征群体进行频次统计;由于无法区分特征权重的重要性,单个特征群体本身可能存在区分不明显,而导致客户推荐内容很有可能都千篇一律,总是偏向于那些热门物品推荐,无法提升客户满意度。

    推荐物品覆盖率低,无法降低物品长尾效应:由于集中在热门物品推荐,因而会导致推荐的物品占总体物品的比较较低,同时还是无法打破物品二八原则,即只将少部分的物品推荐给大部分的客户,长尾效应依然明显。

    需要较大资源消耗:传统的用户冷启动需要频繁且定期进行大规模(例如上亿客户)频率统计;且对于客户端来说,每次需要针对客户进行多次频繁的特征聚合排序,这些消耗资源较为显著。

    为了解决上述问题,本说明书一个或多个实施例提供了一种在用户冷启动场景下的险种推荐方法,图1为本说明书一个或多个实施例提供的在用户冷启动场景下的险种推荐方法的一种流程示意图,险种推荐方法包括:

    s110、获取目标用户的注册信息。

    注册信息是指用户进行注册时录入的信息,用户可以是个人用户也可以是企业用户,对于个人用户,注册信息例如年龄、性别、地域、职业、收入情况和意向保费等信息;对于企业用户,注册信息例如企业规模、企业性质、企业在职人员、企业职业类型和购买时间等信息。作为一个示例,获取的目标用户的注册信息包括单位性质(经济)、单位性质(法律)、单位行业类别、职业代码、投保所在季度、所在机构、在职人数、近三年赔付率、意向人均保费和距离当前时间间隔等信息。

    s120、根据所述注册信息,通过预先构建的用户集合确定模型,确定所述目标用户对应的用户集合。

    构建的用户集合确定模型的方法包括:构建包括若干样本的样本集;其中所述样本包括:样本数据和标签数据;所述样本数据包括历史用户的注册信息和险种选择信息;所述标签数据包括所述历史用户对应的用户集合;

    根据所述样本集,通过预定的机器学习算法,构建并训练得到所述用户集合确定模型。

    其中,预定的机器学习算法可以选自朴素贝叶斯算法、决策树算法、支持向量机算法、knn算法、神经网络算法、深度学习算法和逻辑回归算法中的一种或多种。

    通过用户集合确定模型可以将用户划分为若干用户集合,同一个用户集合中的用户的保险需求存在相关性。

    在用户集合确定模型构建后,对于新注册的用户即目标用户,将目标用户的注册信息输入用户集合确定模型,输出目标用户对应的用户集合。

    通过确定目标用户对应的用户集合的方式,对目标用户的注册信息进行了初步匹配,过滤了历史用户的信息中相关性较小的信息,提高了险种推荐的针对性,也提高了后续的运算效率。

    s130、在所述用户集合中,通过预先构建的相似用户确定模型,确定所述目标用户的相似用户。

    发明人发现,现有的推荐方法在所有历史用户的数据基础上进行推荐,那么,数量较大的相似用户群体选择的险种,即热门险种,被推荐的概率会增大,相应的,数量较小的相似用户群体的需求即容易被忽略。这样,一方面,对于用户来讲,推荐的准确性会被降低,另一方面,对于产品来讲,只将少部分的物品推荐给大部分的用户,长尾效应明显,产品覆盖率较低。

    本发明在前述步骤确定了目标用户的用户集合的基础上,再确定目标用户的相似用户,相应的,最直观的,因为不同用户集合的需求不同,所以不同用户集合的推荐的险种之间具有差别,既提高了推荐的准确性,也提高了产品的覆盖率,有效改善长尾效应。

    构建的相似用户确定模型的方法包括:构建包括若干第二样本的第二样本集;其中所述第二样本包括:第二样本数据和第二标签数据;所述第二样本数据包括所述历史用户的注册信息、险种选择信息和所述历史用户对应的用户集合;所述第二标签数据包括所述历史用户的相似用户;

    根据所述第二样本集,通过预定的第二机器学习算法,构建并训练得到所述相似用户确定模型。

    其中,预定的机器学习算法可以选自朴素贝叶斯算法、决策树算法、支持向量机算法、knn算法、神经网络算法、深度学习算法和逻辑回归算法中的一种或多种。

    在相似用户确定模型构建后,对于新注册的用户即目标用户,将目标用户的注册信息和目标用户对应的用户集合信息输入相似用户确定模型,输出目标用户对应的相似用户。

    s140、根据所述相似用户选择的险种,确定所述目标用户的推荐险种。

    基于协同过滤的思想,对于与目标用户相似度较高的用户选择的险种,目标用户选择该险种的可能性较大,所以,将上述筛选出来的相似用户选择的所有险种,根据其被该用户集合内用户选择的频次高低,从高到低排序,将排序靠前的若干险种,作为推荐险种。作为一个示例,可以将前三种险种或者前五种险种作为推荐险种。

    图2为本说明书一个或多个实施例提供的相似用户确定模型构建方法的一种流程示意图,相似用户确定模型构建方法包括:

    作为一个可选的实施例,本发明提供的相似用户确定模型基于knn(k-nearestneighbor,k最近邻)算法构建。

    knn算法的思路是:在特征空间中,如果一个样本附近的k个最近(即特征空间中最邻近)样本的大多数属于某一个类别,则该样本也属于这个类别。通过相似用户确定模型,可以确定目标用户的相似用户。在一种可能的实施方式中,确定一百个相似用户。

    s210、将所述用户集合中的历史用户的注册信息的特征分为离散型特征和连续型特征。

    注册信息包括若干项,对于个人用户,注册信息例如年龄、性别、地域、职业、收入情况和意向保费等信息;对于企业用户,注册信息例如单位性质(经济)、单位性质(法律)、单位行业类别、职业代码、投保所在季度、所在机构、在职人数、近三年赔付率、意向人均保费和距离当前时间间隔等。根据各项注册信息的业务含义对用户的注册信息进行拆分,一般的,连续型类别不可数,离散型类别可数。例如,对于个人用户,性别、地域和职业为离散型特征,年龄、收入情况和意向保费为连续性特征。对于企业用户,离散型特征包括单位性质(经济)、单位性质(法律)、单位行业类别、职业代码、投保所在季度和所在机构等。连续型特征包括在职人数、近三年赔付率、意向人均保费和距离当前时间间隔等。

    s220、利用汉明距离n_unequal(x,y)计算所述离散型特征的相似度和利用曼哈顿距离sum(|x-y|)计算所述连续型特征的相似度,则计算用户相似度的公式为:n_unequal(x,y)*kl sum(|x-y|)*kx。

    现有技术中一般使用欧氏距离计算特征之间的相似度,欧氏距离将样本的不同属性(即各指标或各变量量纲)之间的差别等同看待,但是,发明人发现,在险种推荐中,个体的不同属性对于区分个体有着不同的重要性。因此,本发明使用不同权重的汉明距离和曼哈顿距离计算特征之间的相似度。

    计算用户相似度的公式为:n_unequal(x,y)*kl sum(|x-y|)*kx。

    其中,kl为离散型特征权重向量,kx为连续型特征权重向量;x和y分别为用户的注册信息的特征。

    对于离散型特征,本发明利用汉明距离n_unequal(x,y)计算其相似度,例如,x=(00,02,05,50103,4,410023),y=(00,01,05,50102,4,410023),则n_unequal(x,y)=2。汉明距离表示两个特征中不同元素的个数,上例中因为有两个不同的元素,所以距离为2。

    s230、构造目标函数p=f(kl,kx);其中,p为推荐准确率。

    构建目标函数p=f(kl,kx)的目的在于用于训练得到计算用户相似度的公式n_unequal(x,y)*kl sum(|x-y|)*kx的权重。将使得p的值最大的权重,作为最优解。

    s240、利用tree-structuredparzenestimator算法,迭代计算得到所述目标函数p=f(kl,kx)的最优解kl和kx,使得p的值最大。

    tree-structuredparzenestimator(tpe)算法可以根据过去的结果构建概率模型,并通过最大化预期的改进来决定下一组超参数以在目标函数中进行评估。

    s250、将所述最优解kl和kx带入n_unequal(x,y)*kl sum(|x-y|)*kx,以构建所述相似用户确定模型。

    在相似用户确定模型构建后,对于新注册的用户即目标用户,将目标用户的注册信息和目标用户对应的用户集合信息输入相似用户确定模型,输出目标用户对应的相似用户。

    图3为本说明书一个或多个实施例提供的目标函数构造方法的一种流程示意图,目标函数构造方法包括:

    s310、初始化kl和kx,根据所述计算用户相似度的公式n_unequal(x,y)*kl sum(|x-y|)*kx,确定所述历史用户的相似用户。

    对于一个用户集合下的所有用户,将其注册信息和保险选择信息作为训练集。对于每一个训练集用户,根据相似度公式n_unequal(x,y)*kl sum(|x-y|)*kx,从该用户集合中筛选出若干最相似的用户,例如100个、200个或者500个,作为相似用户。

    s320、根据所述历史用户的相似用户选择的险种,确定所述历史用户的推荐险种。

    相似用户选择的险种即为备选险种,将备选险种按照被选择的频次由大到小的顺序排列,将频次较大的若干险种,作为推荐险种,比如1个、3个或者5个。

    s330、计算所述历史用户的推荐险种命中所述历史用户的选择险种的次数,作为命中数。

    训练集用户在历史记录中是存在真实选择的险种的,即保险选择信息,对比真实选择的险种和推荐险种,如果相同,则认为推荐险种命中选择险种。

    作为一个可选的实施例,也可以预先设置选择的险种,以控制引导推荐方向。

    s340、根据所述命中数和推荐次数,得到推荐准确率p。

    训练完成后,总的命中数和总的测试数的比值,即为推荐准确度。

    图4为本说明书一个或多个实施例提供的最优解求解方法的一种流程示意图,最优解求解方法包括:

    s410、初始化权重向量(kl,kx)为k0。

    s420、将k0带入所述目标函数p=f(kl,kx),得到p值p0,利用(k0,p0)表示第一次获得向量。

    s430、将所述第一次获得向量{(k0,p0)}带入tree-structuredparzenestimator算法,得到权重向量k1;将k1带入所述目标函数p=f(kl,kx),得到p值p1,利用(k1,p1)表示第二次获得向量。

    s440、将所述第一次获得向量和第二次获得向量{(k0,p0),(k1,p1)}带入tree-structuredparzenestimator算法,得到权重向量k2;将k2带入所述目标函数p=f(kl,kx),得到p值p2,利用(k2,p2)表示第三次获得向量。

    s450、按照预设的次数迭代计算,将最大的p值对应的kl和kx作为所述目标函数p=f(kl,kx)的最优解。

    作为一个示例,第一次:初始化权重向量(kl,kx)为k0,假设k0值为(1,1,1,1,1,1,1,1,1,1),经目标函数p=f(kl,kx),得到的p0值为0.72;将(k0,p0)作为第一次获得向量;

    第二次:将上述的第一次获得向量{(k0,p0)}带入tpe算法,得到k1值为(1,0.1,0.3,0.7,0.1,0.4,0.6,0.7,0.3,0.4),经目标函数p=f(kl,kx),得到的p1值为0.65;将{(k0,p0),(k1,p1)}作为第二次获得向量;

    第三次:将上述的第一次获得向量和第二次获得向量{(k0,p0),(k1,p1)}带入至tpe算法中,得到k2值为(0.75,0.9,0.7,0.66,0.32,0.43,0.62,0.63,0.23,0.13),经目标函数p=f(kl,kx),得到的p2值为0.78;将{(k0,p0),(k1,p1),(k2,p2)}作为第三次获得向量;

    第四次:将上述的第一次获得向量、第二次获得向量和第三次获得向量{(k0,p0),(k1,p1),(k2,p2)}带入至tpe算法中,得到k3值为(0.6,1.2,0.77,0.63,0.31,0.49,0.34,0.67,0.98,0.34),经目标函数p=f(kl,kx),得到的p3值为0.85;将{(k0,p0),(k1,p1),(k2,p2),(k3,p3)}作为第四次获得向量;

    ……

    第一万次:将上述的第一次获得向量到第9999次获得向量={(k0,p0),(k1,p1),(k2,p2)…(k9999,p9999)}带入至tpe算法中,得到k10000值为(0.21,1.21,0.88,1.33,2.31,9.23,3.31,6.71,3.89,4.41),经目标函数,得到的p10000值为0.83。

    将上述一万次迭代中最大的p值对应的k值,作为最优解。假设上述一万次中最大的p值发生在第四次,即p3=0.85,则(0.6,1.2,0.77,0.63,0.31,0.49,0.34,0.67,0.98,0.34)作为k的最优解,即kl为(0.6,1.2,0.77,0.63,0.31);kx为(0.49,0.34,0.67,0.98,0.34)。

    从上面所述可以看出,本说明书一个或多个实施例提供的在用户冷启动场景下的险种推荐方法,包括:获取目标用户的注册信息;根据所述注册信息,通过预先构建的用户集合确定模型,确定所述目标用户对应的用户集合;在所述用户集合中,通过预先构建的相似用户确定模型,确定所述目标用户的相似用户;根据所述相似用户选择的险种的频次,确定所述目标用户的推荐险种。本发明通过初步确定用户集合,再在用户集合中确定相似用户的方式,提高了险种推荐的准确性,提高了险种推荐的覆盖率,降低了资源消耗。

    需要说明的是,本说明书一个或多个实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本说明书一个或多个实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。

    需要说明的是,上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

    基于同一发明构思,与上述任意实施例方法相对应的,本说明书一个或多个实施例还提供了一种在用户冷启动场景下的险种推荐装置。

    参考图5,所述在用户冷启动场景下的险种推荐装置,包括:

    注册信息获取模块510,用于获取目标用户的注册信息。

    用户集合确定模块520,用于根据所述注册信息,通过预先构建的用户集合确定模型,确定所述目标用户对应的用户集合。

    相似用户确定模块530,用于在所述用户集合中,通过预先构建的相似用户确定模型,确定所述目标用户的相似用户。

    推荐险种确定模块540,用于根据所述相似用户选择的险种,确定所述目标用户的推荐险种。

    可选的,相似用户确定模块530,具体用于:

    将所述用户集合中的历史用户的注册信息特征分为离散型特征和连续型特征;

    利用汉明距离n_unequal(x,y)计算所述离散型特征的相似度和利用曼哈顿距离sum(|x-y|)计算所述连续型特征的相似度,则计算用户相似度的公式为:n_unequal(x,y)*kl sum(|x-y|)*kx;其中,kl为离散型特征权重向量,kx为连续型特征权重向量;

    构造目标函数p=f(kl,kx);其中,p为推荐准确率;

    利用tree-structuredparzenestimator算法,迭代计算得到所述目标函数p=f(kl,kx)的最优解kl和kx,使得p的值最大;

    将所述最优解kl和kx带入n_unequal(x,y)*kl sum(|x-y|)*kx,构建所述相似用户确定模型。

    为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书一个或多个实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现。

    上述实施例的装置用于实现前述任一实施例中相应的在用户冷启动场景下的险种推荐方法,并且具有相应的方法实施例的有益效果,在此不再赘述。

    基于同一发明构思,与上述任意实施例方法相对应的,本说明书一个或多个实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上任意一实施例所述的在用户冷启动场景下的险种推荐方法。

    图6示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。

    处理器1010可以采用通用的cpu(centralprocessingunit,中央处理器)、微处理器、应用专用集成电路(applicationspecificintegratedcircuit,asic)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。

    存储器1020可以采用rom(readonlymemory,只读存储器)、ram(randomaccessmemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。

    输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。

    通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如usb、网线等)实现通信,也可以通过无线方式(例如移动网络、wifi、蓝牙等)实现通信。

    总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。

    需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。

    上述实施例的电子设备用于实现前述任一实施例中相应的在用户冷启动场景下的险种推荐方法,并且具有相应的方法实施例的有益效果,在此不再赘述。

    基于同一发明构思,与上述任意实施例方法相对应的,本说明书一个或多个实施例还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上任一实施例所述的在用户冷启动场景下的险种推荐方法。

    本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。

    上述实施例的存储介质存储的计算机指令用于使所述计算机执行如上任一实施例所述的在用户冷启动场景下的险种推荐方法,并且具有相应的方法实施例的有益效果,在此不再赘述。

    所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本公开的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本说明书一个或多个实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。

    另外,为简化说明和讨论,并且为了不会使本说明书一个或多个实施例难以理解,在所提供的附图中可以示出或可以不示出与集成电路(ic)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本说明书一个或多个实施例难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本说明书一个或多个实施例的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本公开的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本说明书一个或多个实施例。因此,这些描述应被认为是说明性的而不是限制性的。

    尽管已经结合了本公开的具体实施例对本公开进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态ram(dram))可以使用所讨论的实施例。

    本说明书一个或多个实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本公开的保护范围之内。


    技术特征:

    1.一种在用户冷启动场景下的险种推荐方法,其特征在于,包括:

    获取目标用户的注册信息;

    根据所述注册信息,通过预先构建的用户集合确定模型,确定所述目标用户对应的用户集合;

    在所述用户集合中,通过预先构建的相似用户确定模型,确定所述目标用户的相似用户;

    根据所述相似用户选择的险种,确定所述目标用户的推荐险种。

    2.根据权利要求1所述的方法,其特征在于,还包括:

    构建包括若干第一样本的第一样本集;其中所述第一样本包括:第一样本数据和第一标签数据;所述第一样本数据包括历史用户的注册信息和险种选择信息;所述第一标签数据包括所述历史用户对应的用户集合;

    根据所述第一样本集,通过预定的第一机器学习算法,构建并训练得到所述用户集合确定模型。

    3.根据权利要求2所述的方法,其特征在于,还包括:

    构建包括若干第二样本的第二样本集;其中所述第二样本包括:第二样本数据和第二标签数据;所述第二样本数据包括所述历史用户的注册信息、险种选择信息和所述历史用户对应的用户集合;所述第二标签数据包括所述历史用户的相似用户;

    根据所述第二样本集,通过预定的第二机器学习算法,构建并训练得到所述相似用户确定模型。

    4.根据权利要求3所述的方法,其特征在于,所述根据所述第二样本集,通过预定的第二机器学习算法,构建并训练得到所述相似用户确定模型,包括:

    将所述用户集合中的历史用户的注册信息的特征分为离散型特征和连续型特征;

    利用汉明距离n_unequal(x,y)计算所述离散型特征的相似度和利用曼哈顿距离sum(|x-y|)计算所述连续型特征的相似度,则计算用户相似度的公式为:n_unequal(x,y)*kl sum(|x-y|)*kx;其中,kl为离散型特征权重向量,kx为连续型特征权重向量;

    构造目标函数p=f(kl,kx);其中,p为推荐准确率;

    利用tree-structuredparzenestimator算法,迭代计算得到所述目标函数p=f(kl,kx)的最优解kl和kx,使得p的值最大;

    将所述最优解kl和kx带入n_unequal(x,y)*kl sum(|x-y|)*kx,构建所述相似用户确定模型。

    5.根据权利要求4所述的方法,其特征在于,所述构造目标函数p=f(kl,kx),包括:

    初始化kl和kx,根据所述计算用户相似度的公式n_unequal(x,y)*kl sum(|x-y|)*kx,确定所述历史用户的相似用户;

    根据所述历史用户的相似用户选择的险种,确定所述历史用户的推荐险种;

    计算所述历史用户的推荐险种命中所述历史用户的选择险种的次数,作为命中数;

    根据所述命中数和推荐次数,得到推荐准确率p。

    6.根据权利要求4所述的方法,其特征在于,所述利用tree-structuredparzenestimator算法,迭代计算得到所述目标函数p=f(kl,kx)的最优解kl和kx,使得p的值最大,包括:

    初始化权重向量(kl,kx)为k0;

    将k0带入所述目标函数p=f(kl,kx),得到p值p0,利用(k0,p0)表示第一次获得向量;

    将所述第一次获得向量{(k0,p0)}带入tree-structuredparzenestimator算法,得到权重向量k1;将k1带入所述目标函数p=f(kl,kx),得到p值p1,利用(k1,p1)表示第二次获得向量;

    将所述第一次获得向量和第二次获得向量{(k0,p0),(k1,p1)}带入tree-structuredparzenestimator算法,得到权重向量k2;将k2带入所述目标函数p=f(kl,kx),得到p值p2,利用(k2,p2)表示第三次获得向量;

    按照预设的次数迭代计算,将最大的p值对应的kl和kx作为所述目标函数p=f(kl,kx)的最优解。

    7.根据权利要求1所述的方法,其特征在于,所述根据所述相似用户选择的险种,确定所述目标用户的推荐险种,包括:

    将所述相似用户选择的险种按照被选择频次从高到低的顺序进行排序,将前预设位数的险种,作为所述推荐险种。

    8.一种在用户冷启动场景下的险种推荐装置,其特征在于,包括:

    注册信息获取模块,用于获取目标用户的注册信息;

    用户集合确定模块,用于根据所述注册信息,通过预先构建的用户集合确定模型,确定所述目标用户对应的用户集合;

    相似用户确定模块,用于在所述用户集合中,通过预先构建的相似用户确定模型,确定所述目标用户的相似用户;

    推荐险种确定模块,用于根据所述相似用户选择的险种,确定所述目标用户的推荐险种。

    9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任意一项所述的方法。

    10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行权利要求1至7任一所述方法。

    技术总结
    一种在用户冷启动场景下的险种推荐方法及相关设备。本说明书一个或多个实施例提供一种在用户冷启动场景下的险种推荐方法,包括:获取目标用户的注册信息;根据所述注册信息,通过预先构建的用户集合确定模型,确定所述目标用户对应的用户集合;在所述用户集合中,通过预先构建的相似用户确定模型,确定所述目标用户的相似用户;根据所述相似用户选择的险种,确定所述目标用户的推荐险种。本发明通过初步确定用户集合,在用户集合中确定相似用户的方式,提高了险种推荐的准确性,提高了险种推荐的覆盖率,降低了资源消耗。

    技术研发人员:林鹏程;鞠芳;梁曦;侯成文;王帅
    受保护的技术使用者:中国人寿保险股份有限公司
    技术研发日:2020.12.01
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-16959.html

    最新回复(0)