本技术涉及热点预测,更具体地说,涉及一种模型训练方法、视频热点预测方法及系统。
背景技术:
1、同一视频内访问量高于其他分片一定阈值即为视频热点的分片。
2、在内容分发网络(contentdeliverynetwork,cdn)、p2p内容分发网络(p2pcontentdeliverynetwork,pcdn)运营过程中会出现很多带宽峰值,这类带宽峰值一般是由于用户观看视频时间比较集中,或者视频热点比较集中所导致,而突发的视频热点造成的瞬时带宽往往带来较大的成本以及服务压力。
3、因此,如何降低热点集中带来的服务压力,是本技术亟需解决的问题。
技术实现思路
1、有鉴于此,本技术公开了一种模型训练方法、视频热点预测方法及系统,旨在通过热点预测模型提前预测某视频或视频中某分片为视频热点分片,通过提前分发热点视频来降低因热点集中带来的服务压力。
2、为了实现上述目的,其公开的技术方案如下:
3、本技术第一方面公开了一种模型训练方法,所述模型训练方法包括:
4、获取用户视频播放熵;
5、通过预设提取方式从所述用户视频播放熵中提取预设数量的目标敏感用户;所述目标敏感用户为符合相关性分析且对视频热点信息敏感的用户;
6、确定预设数量的目标敏感用户所访问的视频分片和各个平均播放熵;
7、获取预设数量的目标敏感用户在视频分片上的各个实际播放熵;
8、将所述各个实际播放熵和所述各个平均播放熵作为特征集合,并通过所述特征集合和训练标签进行模型训练,得到热点预测模型;其中,所述训练标签为所述视频分片在预设时间周期内成为视频热点分片的标签。
9、优选的,所述获取用户视频播放熵,包括:
10、计算各个历史视频的标准播放信息熵和各个历史视频的实际播放信息熵;所述标准播放信息熵表示每个视频完整播放一遍的信息熵;
11、将所述各个历史视频的实际播放信息熵与所述各个历史视频的标准播放信息熵进行求商计算,得到预设数量的初始用户视频播放熵;
12、在预设时间周期内,将所述预设数量的初始用户视频播放熵进行求平均值计算,得到用户视频播放熵。
13、优选的,所述通过预设提取方式从所述用户视频播放熵中提取预设数量的目标敏感用户,包括:
14、统计各个用户在预设统计周期内播放预设数量的视频分片的个数和视频分片中的视频热片播放的次数;
15、通过所述视频分片的个数和所述视频热片播放的次数,确定各个用户播放热点分片的访问概率;
16、通过预设排序方式将所述各个用户播放热点分片的访问概率进行排序,得到排序结果,并对所述排序结果和所述用户视频播放熵进行相关性分析,得到不符合相关性分析的用户;所述不符合相关性分析的用户为相关性数值小于等于预设相关性阈值的用户;
17、从各个用户中剔除不符合相关性分析的用户,得到预设数量的目标敏感用户。
18、优选的,所述从各个用户中剔除不符合相关性分析的用户,得到预设数量的目标敏感用户,包括:
19、从所述排序结果中确定在预设排序范围外用户在视频分片上的播放熵均值小于等于预设阈值的原始访问概率;
20、将所述原始访问概率确定为不符合相关性分析的访问概率;
21、从各个用户中剔除不符合相关性分析的访问概率所对应的无效用户,得到预设数量的目标敏感用户。
22、优选的,所述视频分片在预设时间周期内成为视频热点分片,包括:
23、获取预设数量的目标敏感用户所访问的视频分片在预设时间周期内的被访问次数;
24、当所述被访问次数大于预设视频分片的被访问次数时,确定所述视频分片在预设时间周期内成为视频热点分片。
25、本技术第二方面公开了一种视频热点预测方法,应用于第一方面任意一项所述的模型训练方法得到的热点预测模型,所述视频热点预测方法包括:
26、获取待预测信息;所述待预测信息至少包括待预测用户的平均播放熵和待预测用户的实际播放信息熵;
27、将所述待预测用户的平均播放熵和所述待预测用户的实际播放信息熵作为输入数据,并将所述输入数据输入至所述热点预测模型进行热点预测,得到预测结果;所述预测结果表示待预测的视频是否存在视频热点分片的预测结果。
28、优选的,还包括:
29、若所述预测结果为存在视频热点分片的预测结果且存在访问动作,确定所述访问动作对应的具体视频分片。
30、优选的,还包括:
31、在应用所述热点预测模型的过程中,若目标敏感用户的人数达到所述热点预测模型要求的预设人数,且所述目标敏感用户访问的视频分片为热点视频分片,进行裂变分发操作。
32、本技术第三方面公开了一种模型训练系统,所述模型训练系统包括:
33、第一获取单元,用于获取用户视频播放熵;
34、提取单元,用于通过预设提取方式从所述用户视频播放熵中提取预设数量的目标敏感用户;所述目标敏感用户为符合相关性分析且对视频热点信息敏感的用户;
35、第一确定单元,用于确定预设数量的目标敏感用户所访问的视频分片和各个平均播放熵;
36、第二获取单元,用于获取预设数量的目标敏感用户在视频分片上的各个实际播放熵;
37、训练单元,用于将所述各个实际播放熵和所述各个平均播放熵作为特征集合,并通过所述特征集合和训练标签进行模型训练,得到热点预测模型;其中,所述训练标签为所述视频分片在预设时间周期内成为视频热点分片的标签。
38、本技术第四方面公开了一种视频热点预测系统,应用于第三方面所述的模型训练系统得到的热点预测模型,所述视频热点预测系统包括:
39、第三获取单元,用于获取待预测信息;所述待预测信息至少包括待预测用户的平均播放熵和待预测用户的实际播放信息熵;
40、预测单元,用于将所述待预测用户的平均播放熵和所述待预测用户的实际播放信息熵作为输入数据,并将所述输入数据输入至所述热点预测模型进行热点预测,得到预测结果;所述预测结果表示待预测的视频是否存在视频热点分片的预测结果。
41、经由上述技术方案可知,本技术公开了一种模型训练方法、视频热点预测方法及系统,获取用户视频播放熵,通过预设提取方式从用户视频播放熵中提取预设数量的目标敏感用户,目标敏感用户为符合相关性分析且对视频热点信息敏感的用户,确定预设数量的目标敏感用户所访问的视频分片和各个平均播放熵,获取预设数量的目标敏感用户在视频分片上的各个实际播放熵,将各个实际播放熵和所述各个平均播放熵作为特征集合,并通过特征集合和训练标签进行模型训练,得到热点预测模型,其中,训练标签为视频分片在预设时间周期内成为视频热点分片的标签。获取待预测信息,待预测信息至少包括待预测用户的平均播放熵和待预测用户的实际播放信息熵,将待预测用户的平均播放熵和待预测用户的实际播放信息熵作为输入数据,并将输入数据输入至热点预测模型进行热点预测,得到预测结果,预测结果表示待预测的视频是否存在视频热点分片的预测结果。通过上述方案,无需人工主动推荐内容,只需从用户视频播放熵中识别出预设数量的目标敏感用户,以及目标敏感用户所访问的视频分片,获取预设数量的目标敏感用户在视频分片上的各个实际播放熵,将各个实际播放熵、各个平均播放熵和训练标签进行模型训练,得到热点预测模型,通过热点预测模型提前预测某视频或视频中某分片为视频热点分片,通过提前分发热点视频来降低因热点集中带来的服务压力。此外,也有效降低了视频厂商带宽成本,提高服务质量。
1.一种模型训练方法,其特征在于,所述模型训练方法包括:
2.根据权利要求1所述的模型训练方法,其特征在于,所述获取用户视频播放熵,包括:
3.根据权利要求1所述的模型训练方法,其特征在于,所述通过预设提取方式从所述用户视频播放熵中提取预设数量的目标敏感用户,包括:
4.根据权利要求3所述的模型训练方法,其特征在于,所述从各个用户中剔除不符合相关性分析的用户,得到预设数量的目标敏感用户,包括:
5.根据权利要求1所述的模型训练方法,其特征在于,所述视频分片在预设时间周期内成为视频热点分片,包括:
6.一种视频热点预测方法,其特征在于,应用于权利要求1至5任意一项所述的模型训练方法得到的热点预测模型,所述视频热点预测方法包括:
7.根据权利要求6所述的视频热点预测方法,其特征在于,还包括:
8.根据权利要求6所述的视频热点预测方法,其特征在于,还包括:
9.一种模型训练系统,其特征在于,所述模型训练系统包括:
10.一种视频热点预测系统,其特征在于,应用于权利要求9所述的模型训练系统得到的热点预测模型,所述视频热点预测系统包括:
