本技术涉及互联网,尤其涉及一种多媒体资源推荐的特征生成方法、设备以及可读存储介质。
背景技术:
1、随着智能手机、平板电脑等终端的功能日益强大,应用于智能手机、平板电脑等终端上的应用程序(或简称应用)的功能也随之日益丰富多样,人们可以通过应用获取自己感兴趣的信息,信息的多样化给终端用户带来了丰富多样的用户体验。如今,应用随着科技进步变得更加人性化,为了给终端用户带来更好的体验感受,各大应用针对终端用户的多媒体资源推荐也更加个性化。
2、一般来说,多媒体资源推荐一般是基于用户对某类多媒体资源的喜好进行相似类型的多媒体资源推荐,或者基于兴趣相投或者拥有共同经验的用户群体的需求或者喜好向用户推荐可能感兴趣的多媒体资源。然而,由于用户基数大,在过往数据中用户感兴趣的多媒体资源数量可达到千亿量级,使得针对用户进行多媒体资源推荐的准确率低,适用性差。
技术实现思路
1、本技术实施例提供一种多媒体资源推荐的特征生成方法、设备以及计算机可读存储介质,可提高多媒体资源的推荐效率,增强多媒体资源推荐的适用性。
2、第一方面,本技术实施例提供了一种多媒体资源推荐的特征生成方法,该方法包括:
3、获取客户端数据源提供的第一对象行为数据,并基于上述第一对象行为数据生成第一对象关联的至少两个不同时间段的至少两种第一对象行为统计特征,其中,上述第一对象为上述第一对象行为数据中携带的各个对象,任一第一对象关联的任一时间段的第一对象行为统计特征中包括对象属性特征、时长属性特征、资源内容属性特征、资源类型属性特征以及对象资源行为属性特征中的至少两种属性特征;
4、获取多媒体资源推荐的训练样本数据源提供的第二对象行为数据,并基于上述第二对象行为数据生成第二对象关联的至少两个不同时间段的至少两种第二对象行为统计特征,其中,上述第二对象为上述第一对象行为数据中携带的各个对象,任一第二对象关联的任一时间段的第二对象行为统计特征中至少两种对象资源行为属性特征;
5、基于各个上述第一对象关联的上述第一对象行为统计特征和各个上述第二对象关联的上述第二对象行为统计特征生成各个对象的对象统计特征,并将上述对象统计特征确定为多媒体资源推荐模型的输入特征,其中,上述多媒体资源推荐模型由上述第二对象行为数据训练得到,上述多媒体资源模型用于基于上述各个对象的对象统计特征输出上述各个对象的多媒体资源推荐值。
6、在一种可能的实现方式中,上述基于所述第一对象行为数据生成第一对象关联的至少两个不同时间段的至少两种第一对象行为统计特征,包括:
7、基于上述第一对象行为数据中携带的各对象行为数据的生成时间生成至少两个不同时间段的至少两级对象行为特征,其中,一级对象行为特征用于生成一个时间段中各个第一对象的对象行为统计特征,不同时间段中包含的对象行为数据的生成时间不重叠;
8、基于上述至少两级对象行为特征中携带的各个第一对象的对象标识生成以上述各个第一对象的对象标识为索引的至少两种第一对象行为统计特征,其中,任一第一对象关联以上述任一第一对象的对象标识为索引的上述至少两个不同时间段的至少两种第一对象行为统计特征。
9、在一种可能的实现方式中,上述基于上述第一对象行为数据中携带的各对象行为数据的生成时间生成至少两个不同时间段的至少两级对象行为特征包括:
10、基于上述第一对象行为数据中携带的各对象行为数据的生成时间,将属于同一个时间段的各个第一对象的对象行为数据划分为同一级的对象行为数据以得到至少两级对象行为数据;
11、基于各级对象行为数据中包括的上述各个第一对象的对象行为数据生成各个第一对象的对象属性特征、时长属性特征、资源内容属性特征、资源类型属性特征以及对象资源行为属性特征中的至少两种属性特征,并将上述各个第一对象关联的上述至少两种属性特征进行拼接,以生成上述各个时间段对应的各级对象行为特征,以得到至少两个不同时间段的至少两级对象行为特征。
12、在一种可能的实现方式中,所述对象资源行为属性特征中包括对象的多媒体资源偏好程度或者多媒体资源的对象偏好程度中的一种或者多种;上述基于各级对象行为数据中包括的上述各个第一对象的对象行为数据生成各个第一对象的对象资源行为属性特征包括:
13、获取各级对象行为数据中包括的任一第一对象的对象行为数据中所述任一第一对象对任一多媒体资源的任一对象行为统计值,将所述任一对象行为统计值与所述各级对象行为数据中所有对象对所述任一多媒体资源的对象行为统计值总和的比值,确定为所述任一第一对象对所述任一多媒体资源的偏好程度以得到所述任一第一对象的多媒体资源偏好程度;或者
14、获取各级对象行为数据中包括的任一第一对象的对象行为数据中所述任一第一对象对任一多媒体资源的任一对象行为统计值,将所述任一对象行为统计值与所述各级对象行为数据中所述任一第一对象对所有多媒体资源的对象行为统计值总和的比值,确定为所述任一第一对象对所述任一多媒体资源的偏好程度以得到所述任一多媒体资源的对象偏好程度。
15、在一种可能的实现方式中,上述对象资源行为属性特征中包括对象对多媒体资源的期望点击量;上述基于各级对象行为数据中包括的上述各个第一对象的对象行为数据生成各个第一对象的对象资源行为属性特征包括:
16、获取各级对象行为数据中包括的任一第一对象的对象行为数据中所述任一第一对象对第一多媒体资源的第一对象行为统计值,获取所述各级对象行为数据中所有对象用户对所述第一多媒体资源的第一对象行为操作比例;
17、获取所述各级对象行为数据中所述任一第一对象的对象行为数据中所述任一第一对象对第二多媒体资源的第二对象行为统计值,获取所述各级对象行为数据中所有用户对象对所述第二多媒体资源的第二对象行为操作比例;
18、基于所述第一对象行为统计值、所述第一对象行为操作比例、所述第二对象行为统计值和所述第二对象行为操作比例,以及所述任一第一对象对所有多媒体资源的对象行为统计值生成所述任一第一对象对多媒体资源的期望点击量,以得到各个所述第一对象的对多媒体资源的期望点击量。
19、在一种可能的实现方式中,上述基于上述第二对象行为数据生成上述第一对象行为数据中携带的各个对象关联的至少两个不同时间段的至少两种第二对象行为统计特征包括:
20、基于上述第二对象行为数据中携带的各对象行为数据的生成时间,将上述第二对象行为数据划分为多个p1级对象行为数据,上述p1级对象行为数据为上述第二对象行为数据按时间区间划分的最小单位时长内包括的对象行为数据;
21、基于多个最小单位时长中包括的多个上述p1级对象行为数据的累积生成至少两种不同时间段的至少两个p2级对象行为数据,其中一个p2级对象行为数据由一个目标时长内的多个上述p1级对象行为数据累积得到,上述目标时长为上述最小单位时长的正整数倍;
22、基于各个上述p2级对象行为数据中携带的各个第二对象对应的对象标识,生成以上述各个第二对象的对象标识为索引的至少两种第二对象行为统计特征,其中,任一第二对象关联以上述任一第二对象的对象标识为索引的上述至少两个不同时间段的至少两种第二对象行为统计特征。
23、在一种可能的实现方式中,上述基于各个上述p2级对象行为数据中携带的各个第二对象对应的对象标识,生成以上述各个第二对象的对象标识为索引的至少两种第二对象行为统计特征包括:
24、基于各个上述p2级对象行为数据中携带的各个第二对象对应的对象标识,生成上述各个第二对象关联的p2级对象行为特征,一个第二对象的p2级对象行为特征中包括上述第二对象的至少两种对象资源行为属性特征;
25、以上述各个第二对象的对象标识为索引,将与上述各个第二对象的对象标识相关联的p2级对象行为特征中至少两种对象资源行为属性特征进行拼接,以生成与上述各个对象标识相关联的第二对象行为统计特征;
26、其中,上述对象资源行为属性特征包括对象针对多媒体资源的点击时长、点击次数、点击率、曝光次数、观看时长以及互动时长中的至少一种对象资源行为关联的特征。
27、在一种可能的实现方式中,上述基于各个上述第一对象关联的上述第一对象行为统计特征和各个上述第二对象关联的上述第二对象行为统计特征生成各个对象的对象统计特征包括:
28、从上述第一对象行为统计特征中获取上述各个第一对象对应的对象标识,从上述第二对象行为统计特征中获取上述各个第二对象对应的对象标识;
29、以上述各个第一对象的对象标识和上述各个第二对象的对象标识为索引,将上述第一对象行为统计特征和上述第二对象行为统计特征拼接,生成与各个对象标识对应的对象统计特征,其中,具有相同对象标识的上述第一对象行为统计特征和上述第二对象行为统计特征拼接为同一个对象的对象统计特征。
30、第二方面,本技术实施例提供了一种多媒体资源推荐的特征生成装置,该装置包括:
31、获取模块,用于获取客户端数据源提供的第一对象行为数据获取所述针对对象行为的第一对象行为数据和第二对象行为数据;
32、第一对象行为统计特征生成模块,用于基于所述获取模块获取的所述第一对象行为数据生成第一对象关联的至少两个不同时间段的至少两种第一对象行为统计特征,其中,所述第一对象为所述第一对象行为数据中携带的各个对象,任一第一对象关联的任一时间段的第一对象行为统计特征中包括对象属性特征、时长属性特征、资源内容属性特征、资源类型属性特征以及对象资源行为属性特征中的至少两种属性特征获取客户端数据源提供的第一对象行为数据,并基于所述第一对象行为数据生成所述第一对象行为数据中携带的各个对象关联的至少两个不同时间段的至少两种第一对象行为统计特征;
33、所述获取模块,还用于获取多媒体资源推荐的训练样本数据源提供的第二对象行为数据;
34、第二对象行为统计所述特征生成模块,还用于基于所述获取模块获取的所述第二对象行为数据生成第二对象关联的至少两个不同时间段的至少两种第二对象行为统计特征,其中,所述第二对象为所述第一对象行为数据中携带的各个对象,任一第二对象关联的任一时间段的第二对象行为统计特征中至少两种对象资源行为属性特征获取多媒体资源推荐的训练样本数据源提供的第二对象行为数据,并基于所述第二对象行为数据生成所述第一对象行为数据中携带的各个对象关联的至少两个不同数据段的至少两种第二对象行为统计特征;
35、特征聚合模块,用于基于各个所述第一对象关联的所述第一对象行为统计特征和各个所述第二对象关联的所述第二对象行为统计特征生成各个对象的对象统计特征,并将所述对象统计特征确定为多媒体资源推荐模型的输入特征,其中,所述多媒体资源推荐模型由所述第二对象行为数据训练得到,所述多媒体资源模型用于基于所述各个对象的对象统计特征输出所述各个对象的多媒体资源推荐值基于所述各个对象关联的所述第一对象行为统计特征和所述第二对象行为统计特征生成所述各个对象的对象统计特征,并将所述对象统计特征确定多媒体资源推荐模型的输入特征。
36、第三方面,本技术实施例提供了一种计算机设备,上述计算机设备包括:处理器、存储器以及网络接口;
37、上述处理器与上述存储器、上述网络接口相连,其中,上述网络接口用于提供数据通信功能,上述存储器用于存储程序代码,上述处理器用于调用上述程序代码,以执行上述第一方面及其任一种可能的实现方式提供的方法。
38、第四方面,本技术实施例提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序包括程序指令,当上述处理器执行上述程序指令时执行如本技术实施例第一方面及其任一种可能的实现方式提供的方法。
39、第五方面,本技术实施例提供了一种计算机程序产品,上述计算机程序产品包括计算机程序,上述计算机程序存储在计算机可读存储介质中,上述计算机程序适于由处理器读取并执行,以使得具有上述处理器的计算机设备执行如本技术实施例第一方面及其任一种可能的实现方式提供的方法。
40、在本技术实施例中,通过目标客户端获取客户端数据源提供的第一对象行为数据,基于上述第一对象行为数据中携带的各对象行为数据的生成时间生成至少两个不同时间段的至少两级对象行为特征。其中,上述第一对象为上述第一对象行为数据中携带的各个对象,任一第一对象关联的任一时间段的第一对象行为统计特征中包括对象属性特征、时长属性特征、资源内容属性特征、资源类型属性特征以及对象资源行为属性特征中的至少两种属性特征。接着,通过目标客户端获取多媒体资源推荐的训练样本数据源提供的第二对象行为数据,基于上述第二对象行为数据生成与上述第二对象关联的至少两个不同时间段的至少两种第二对象行为统计特征。其中,上述第二对象为上述第一对象行为数据中携带的各个对象,任一第二对象关联的任一时间段的第二对象行为统计特征中至少两种对象资源行为属性特征。最后,基于各个第一对象关联的第一对象行为统计特征和各个第二对象关联的第二对象行为统计特征生成各个对象的对象统计特征,并将上述对象统计特征确定为多媒体资源推荐模型的输入特征。其中,上述多媒体资源推荐模型由上述第二对象行为数据训练得到,上述多媒体资源模型用于基于各个对象的对象统计特征输出上述各个对象的多媒体资源推荐值,可提供更加全面、清晰、易扩展的统计特征体系,提高多媒体资源推荐的计算资源、模型训练资源以及存储资源的利用率,提高多媒体资源的推荐准确率和效率,增强了适用性。
1.一种多媒体资源推荐的特征生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一对象行为数据生成第一对象关联的至少两个不同时间段的至少两种第一对象行为统计特征,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述第一对象行为数据中携带的各对象行为数据的生成时间生成至少两个不同时间段的至少两级对象行为特征包括:
4.根据权利要求3所述的方法,其特征在于,所述对象资源行为属性特征中包括对象的多媒体资源偏好程度或者多媒体资源的对象偏好程度中的一种或者多种;所述基于各级对象行为数据中包括的所述各个第一对象的对象行为数据生成各个第一对象的对象资源行为属性特征包括:
5.根据权利要求3所述的方法,其特征在于,所述对象资源行为属性特征中包括对象对多媒体资源的期望点击量;所述基于各级对象行为数据中包括的所述各个第一对象的对象行为数据生成各个第一对象的对象资源行为属性特征包括:
6.根据权利要求1-5任一项所述的方法,其特征在于,所述基于所述第二对象行为数据生成所述第一对象行为数据中携带的各个对象关联的至少两个不同时间段的至少两种第二对象行为统计特征包括:
7.根据权利要求6所述的方法,其特征在于,所述基于各个所述p2级对象行为数据中携带的各个第二对象对应的对象标识,生成以所述各个第二对象的对象标识为索引的至少两种第二对象行为统计特征包括:
8.根据权利要求7所述的方法,其特征在于,所述基于各个所述第一对象关联的所述第一对象行为统计特征和各个所述第二对象关联的所述第二对象行为统计特征生成各个对象的对象统计特征包括:
9.一种多媒体资源推荐的特征生成装置,其特征在于,包括:
10.一种计算机设备,其特征在于,包括:处理器、存储器以及网络接口;
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序适于由处理器加载并执行权利要求1-8任一项所述的方法。
12.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序存储在计算机可读存储介质中,所述计算机程序适于由处理器读取并执行,以使得具有所述处理器的计算机设备执行权利要求1-8任一项所述的方法。
