本技术涉及数据处理领域,尤其涉及异常账户确定方法、装置及计算机可读存储介质。
背景技术:
1、随着通信业务的发展,一些通信代理商因为自身的需求,会伪装为正常用户申请通信账户,然后非法倒卖通信账户。
2、上述通信账户被称为异常账户,为识别众多账户中的异常账户,现有的一种方案是由人工依靠经验判断某个账户是否为异常账户,然而,随着通信账户的日益增多,该方案确定异常账户所需的时长较长,以及人工经验的局限性,该方案常常出现误判,因此,现有的方案在确定异常账户时的效率较低。
技术实现思路
1、本技术提供一种异常账户确定方法、装置及计算机可读存储介质,能够提升定异常账户的效率。
2、为达到上述目的,本技术采用如下技术方案:
3、第一方面,提供了一种异常账户确定方法,方法包括:获取多个账户特征,账户特征用于表示与账户特征对应的账户的多个指标;多个指标用于确定账户是否为异常账户;对与多个账户一一对应的多个账户特征进行聚类,得到至少一个目标聚类结果;针对至少一个目标聚类结果中的每个目标聚类结果,将目标聚类结果中异常账户特征对应的账户确定为异常账户;异常账户特征与异常账户特征归属的目标聚类结果的聚类中心的相似度大于第一阈值。
4、基于该方案,与现有的人工判断账户是否为异常账户的方案相比,本技术通过获取多个账户中每个账户的账户特征,然后,对与多个账户一一对应的多个账户特征进行聚类,得到至少一个目标聚类结果,最后,针对每个目标聚类结果,将目标聚类结果中异常账户特征对应的账户确定为异常账户。一般情况下,异常账户的多个指标与正常账户的多个指标之间存在着差异,由于账户特征用于指示账户的多个指标,在确定目标聚类结果后,异常账户特征与目标聚类结果的聚类中心之间的距相似度大于第一阈值,说明异常账户特征与聚类中心的差异相较于其他账户特征与聚类中心的差异较大,通过将异常账户特征对应的账户确定异常账户,无需再依赖于人工的经验确定异常账户,减少了确定异常账户所需的时长,以及减少了误判的发生,从而提升了确定异常账户的效率。
5、结合第一方面,在第一方面的某些实施方式中,多个指标包括:账户的入网时长、账户在预设时间段内的通话时长、账户在预设时间段内使用的流量、账户在预设时间段内的日均在网时长、账户对应的用户标识的预设次数、账户在预设时间段内的缴费金额和/或账户在预设时间段内的月均消费金额;预设次数为用户标识申请账户的次数。
6、结合第一方面,在第一方面的某些实施方式中,对与多个账户一一对应的多个账户特征进行聚类,得到至少一个目标聚类结果,包括:获取聚类参数;聚类参数用于指示聚类结果的数量;将聚类参数和多个账户特征中每个账户特征输入预设聚类算法,得到多个初始聚类结果;基于多个初始聚类结果确定多个目标聚类结果。
7、基于该方案,通过获取聚类参数,然后,将聚类参数和多个账户特征中每个账户特征输入预设聚类算法,得到多个初始聚类结果,最后,基于多个初始聚类结果确定多个目标聚类结果,能够实现对与多个账户一一对应的多个账户特征进行聚类,得到至少一个目标聚类结果的方案。
8、结合第一方面,在第一方面的某些实施方式中,基于多个初始聚类结果确定多个目标聚类结果,包括:针对每个初始聚类结果中的每个账户特征,确定账户特征的轮廓系数;将多个账户特征的轮廓系数的平均值作为多个初始聚类结果的评估指数;在评估指数大于第二阈值的情况下,将多个初始聚类结果确定为多个目标聚类结果。
9、基于该方案,通过针对每个初始聚类结果中的每个账户特征,确定每个账户特征的轮廓系数;然后,将多个账户特征的轮廓系数的平均值作为多个初始聚类结果的评估指数;在评估指数大于第二阈值的情况下,将多个初始聚类结果确定为多个目标聚类结果。在本领域中,由于轮廓系数与账户特征量的聚类质量具有正相关关系,而评估指数为多个账户特征的轮廓系数的平均值,因此,评估指数与多个初始聚类结果的聚类质量也具有正相关关系,在评估指数大于第二阈值的情况下,将多个初始聚类结果确定为多个目标聚类结果,可以提升多个目标聚类结果的聚类质量。
10、第二方面,提供了一种异常账户确定装置用于实现上述第一方面的异常账户确定方法。该异常账户确定装置包括实现上述方法相应的模块、单元、或手段(means),该模块、单元、或means可以通过硬件实现,软件实现,或者通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块或单元。
11、结合第二方面,在第二方面的某些实施方式中,异常账户确定装置包括:获取模块和处理模块;获取模块,用于获取多个账户特征,账户特征用于表示与账户特征对应的账户的多个指标;多个指标用于确定账户是否为异常账户;处理模块,用于对与多个账户一一对应的多个账户特征进行聚类,得到至少一个目标聚类结果;处理模块,还用于针对至少一个目标聚类结果中的每个目标聚类结果,将目标聚类结果中异常账户特征对应的账户确定为异常账户;异常账户特征与异常账户特征归属的目标聚类结果的聚类中心的相似度大于第一阈值。
12、结合第二方面,在第二方面的某些实施方式中,多个指标包括:账户的入网时长、账户在预设时间段内的通话时长、账户在预设时间段内使用的流量、账户在预设时间段内的日均在网时长、账户对应的用户标识的预设次数、账户在预设时间段内的缴费金额和/或账户在预设时间段内的月均消费金额;预设次数为用户标识申请账户的次数。
13、结合第二方面,在第二方面的某些实施方式中,处理模块,用于对与多个账户一一对应的多个账户特征进行聚类,得到至少一个目标聚类结果,包括:获取聚类参数;聚类参数用于指示聚类结果的数量;将聚类参数和多个账户中每个账户特征的账户特征输入预设聚类算法,得到多个初始聚类结果;基于多个初始聚类结果确定多个目标聚类结果。
14、结合第二方面,在第二方面的某些实施方式中,处理模块,还用于基于多个初始聚类结果确定多个目标聚类结果,包括:针对每个初始聚类结果中的每个账户特征,确定账户特征的轮廓系数将多个账户特征的轮廓系数的平均值作为多个初始聚类结果的评估指数;在评估指数大于第二阈值的情况下,将多个初始聚类结果确定为多个目标聚类结果。
15、第三方面,提供了一种异常账户确定装置,包括:至少一个处理器、用于存储处理器可执行的指令的存储器;其中,处理器被配置为执行指令,以实现如第一方面及其任一种可能的实施方式所提供的方法。
16、第四方面,提供了一种计算机可读存储介质,当计算机可读存储介质中的指令由异常账户确定装置的处理器执行时,使得异常账户确定装置能够执行如第一方面及其任一种可能的实施方式所提供的方法。
17、第五方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机可以执行上述第一方面及其任一种可能的实施方式所提供的方法。
18、第六方面,提供了一种芯片系统,包括:处理器和接口电路;接口电路,用于接收计算机程序或指令并传输至处理器;处理器用于执行计算机程序或指令,以使该芯片系统执行如上述第一方面及其任一种可能的实施方式所提供的方法。
19、其中,第二方面至第六方面中任一种实施方式所带来的技术效果可参见上述第一方面不同实施方式所带来的技术效果,在此不再赘述。
1.一种异常账户确定方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述多个指标包括:所述账户的入网时长、所述账户在预设时间段内的通话时长、所述账户在所述预设时间段内使用的流量、所述账户在所述预设时间段内的日均在网时长、所述账户对应的用户标识的预设次数、所述账户在所述预设时间段内的缴费金额和/或所述账户在所述预设时间段内的月均消费金额;所述预设次数为所述用户标识申请账户的次数。
3.根据权利要求1或2所述的方法,其特征在于,所述对与所述多个账户一一对应的多个账户特征进行聚类,得到至少一个目标聚类结果,包括:
4.根据权利要求3所述的方法,其特征在于,所述基于所述多个初始聚类结果确定所述多个目标聚类结果,包括:
5.一种异常账户确定装置,其特征在于,所述异常账户确定装置包括:获取模块和处理模块;
6.根据权利要求5所述的异常账户确定装置,其特征在于,所述多个指标包括:所述账户的入网时长、所述账户在预设时间段内的通话时长、所述账户在所述预设时间段内使用的流量、所述账户在所述预设时间段内的日均在网时长、所述账户对应的用户标识的预设次数、所述账户在所述预设时间段内的缴费金额和/或所述账户在所述预设时间段内的月均消费金额;所述预设次数为所述用户标识申请账户的次数。
7.根据权利要求5或6所述的异常账户确定装置,其特征在于,所述处理模块,用于对与所述多个账户一一对应的多个账户特征进行聚类,得到至少一个目标聚类结果,包括:
8.根据权利要求7所述的异常账户确定装置,其特征在于,所述处理模块,还用于基于所述多个初始聚类结果确定所述多个目标聚类结果,包括:
9.一种异常账户确定装置,其特征在于,所述异常账户确定装置包括:处理器,所述处理器与存储器耦合,所述存储器用于存储程序或指令,当所述程序或指令被所述处理器执行时,使得所述装置执行如权利要求1至4中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序或指令,其特征在于,所述计算机程序或指令被执行时使得计算机执行如权利要求1至4中任一项所述的方法。