物联卡应用范围的确定方法、装置及计算机可读存储介质与流程

    专利2022-07-08  93


    本发明属于数据处理技术领域,尤其涉及物联卡应用范围的确定方法、装置及计算机可读存储介质。



    背景技术:

    随着物联网技术的快速发展,物联网已初步形成了完整的产业体系,具备了一定的技术、产业和应用基础。物联卡作为物联网的核心载体,近年来的发放量更是呈井喷式增长,广泛应用于共享经济、车联网以及移动支付等领域。运营商在发放物联卡时会标注物联卡的应用范围、如应用行业,但在实际应用中,物联卡可能流向其他应用范围,严重扰乱对物联卡的监管及运营分析工作。

    对于物联卡运营商,当前亟待解决的问题是确定发放出的物联卡的真实应用范围,从而提升市场监管能力。在现有技术中,通常是根据物联卡在运行过程中的运行数据来得到物联卡的运行状态,如网络状态,而无法对物联卡的真实应用范围进行预测。综上,在现有技术中无法确定出真实应用范围异常的物联卡,导致物联卡监管效果差,不利于物联网的良性发展。



    技术实现要素:

    有鉴于此,本发明的主要目的在于提供一种物联卡应用范围的确定方法、装置及计算机可读存储介质,以解决现有技术中物联卡监管效果差的问题。

    为达到上述目的,本发明的技术方案是这样实现的:

    本发明实施例的第一方面提供了一种物联卡应用范围的确定方法,包括:

    确定待测物联卡在设定周期内的周期数据,所述周期数据包括所述待测物联卡对应的标注应用范围,所述标注应用范围为设定的预期应用范围;

    根据分类函数对所述周期数据进行计算得到预测应用范围,其中,所述分类函数由对至少两个有监督物联卡的所述周期数据进行有监督训练得到,所述有监督物联卡是指对应的所述标注应用范围已确认正确的物联卡;

    若所述待测物联卡的所述标注应用范围与所述预测应用范围不符,则将所述待测物联卡确定为异常物联卡。

    本发明实施例的第二方面提供了一种物联卡应用范围的确定装置,包括:

    第一确定单元,用于确定待测物联卡在设定周期内的周期数据,所述周期数据包括所述待测物联卡对应的标注应用范围,所述标注应用范围为设定的预期应用范围;

    计算单元,用于根据分类函数对所述周期数据进行计算得到预测应用范围,其中,所述分类函数由对至少两个有监督物联卡的所述周期数据进行有监督训练得到,所述有监督物联卡是指对应的所述标注应用范围已确认正确的物联卡;

    第二确定单元,用于若所述待测物联卡的所述标注应用范围与所述预测应用范围不符,则将所述待测物联卡确定为异常物联卡。

    本发明实施例的第三方面提供了一种物联卡应用范围的确定装置,该确定装置包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如下步骤:

    确定待测物联卡在设定周期内的周期数据,所述周期数据包括所述待测物联卡对应的标注应用范围,所述标注应用范围为设定的预期应用范围;

    根据分类函数对所述周期数据进行计算得到预测应用范围,其中,所述分类函数由对至少两个有监督物联卡的所述周期数据进行有监督训练得到,所述有监督物联卡是指对应的所述标注应用范围已确认正确的物联卡;

    若所述待测物联卡的所述标注应用范围与所述预测应用范围不符,则将所述待测物联卡确定为异常物联卡。

    本发明实施例的第四方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现如下步骤:

    确定待测物联卡在设定周期内的周期数据,所述周期数据包括所述待测物联卡对应的标注应用范围,所述标注应用范围为设定的预期应用范围;

    根据分类函数对所述周期数据进行计算得到预测应用范围,其中,所述分类函数由对至少两个有监督物联卡的所述周期数据进行有监督训练得到,所述有监督物联卡是指对应的所述标注应用范围已确认正确的物联卡;

    若所述待测物联卡的所述标注应用范围与所述预测应用范围不符,则将所述待测物联卡确定为异常物联卡。

    本发明实施例与现有技术相比存在的有益效果是:

    本发明实施例通过确定待测物联卡在设定周期内的周期数据,根据分类函数对周期数据进行计算得到预测应用范围,若预测应用范围与待测物联卡的标注应用范围不符,则将待测物联卡确定为异常物联卡,本发明实施例通过有监督训练得到的分类函数对待测物联卡进行应用范围预测,从而确定应用范围异常的物联卡,提升了物联卡的监管效果,促进物联网的良性发展。

    附图说明

    图1是本发明实施例提供的物联卡应用范围的确定方法的实现流程图;

    图2是本发明实施例提供的对至少两个所述有监督样本进行训练得到分类函数的实现流程图;

    图3是本发明实施例提供的确定目标训练策略的实现流程图;

    图4是本发明实施例提供的确定有监督样本的实现流程图;

    图5是本发明实施例提供的对标注应用范围对应的初始样本进行聚类分析得到至少两个聚类的实现流程图;

    图6是本发明实施例提供的分类示意图;

    图7是本发明实施例提供的分类函数的应用流程图;

    图8是本发明实施例提供的确定有监督样本的流程图;

    图9是本发明实施例提供的物联卡应用范围的确定装置的结构框图;

    图10是本发明实施例提供的物联卡应用范围的确定装置的示意图。

    具体实施方式

    以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。

    为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。

    图1示出了本发明实施例提供的物联卡应用范围的确定方法的实现流程,详述如下:

    在s101中,确定待测物联卡在设定周期内的周期数据,所述周期数据包括所述待测物联卡对应的标注应用范围,所述标注应用范围为设定的预期应用范围。

    物联卡是运营商发放的用于物联网设备联网的工具,在联网功能上与用户身份识别(subscriberidentificationmodule,sim)卡类似。运营商在发放物联卡时,通常是针对某一个应用范围进行批量发放,并且为发放的物联卡设定标注应用范围,应用范围可通过应用行业、应用地域或其他单位来界定,举例来说,若应用范围为应用行业,则发放至共享单车行业的物联卡,运营商为其设定的标注应用范围为共享单车行业。运营商在发放物联卡后,物联卡在应用过程中的真实应用范围可能与其标注应用范围并不一致,比如不法分子将原本发放至共享单车行业的物联卡作为流量卡贩卖给个人用户,导致运营商无法对物联卡进行有效监管。

    针对上述情况,在本发明实施例中,确定待测物联卡在设定周期内的周期数据,周期数据可以包括指示待测物联卡本身的静态数据,如标注应用范围,还可以包括待测物联卡在运行过程中产生的动态数据。设定周期可根据实际应用场景中标注应用范围对应的物联卡的使用规律进行确定,如标注应用范围对应物联卡的使用规律是以天为间隔,则可将设定周期确定为一天;如使用规律是以一小时为间隔,则可将设定周期确定为一小时。在本发明实施例中,周期数据应至少包括标注应用范围,除此之外,周期数据还可包括如物联卡号、网络接入类型、移动距离、跨越小区数、活跃中心经度、活跃中心纬度、活跃半径、上行字节数、下行字节数、上线请求数、报文数、短信使用量、通用分组无线服务(generalpacketradioservice,gprs)使用量、客户类型、卡物理类型、产品类型人工分类及套餐费用等数据,可根据实际应用场景选定周期数据的具体内容。

    一种实现方式中,确定待测物联卡在最近的一个设定周期内的周期数据。待测物联卡在运行过程中,其周期数据可能会随着时间推移而发生改变,故在本发明实施例中,确定待测物联卡在最近的一个设定周期内的周期数据,从而提升周期数据的准确性。

    在s102中,根据分类函数对所述周期数据进行计算得到预测应用范围,其中,所述分类函数由对至少两个有监督物联卡的所述周期数据进行有监督训练得到,所述有监督物联卡是指对应的所述标注应用范围已确认正确的物联卡。

    在本步骤中,根据分类函数对待测物联卡的周期数据进行计算得到预测应用范围,将该预测应用范围视为待测物联卡的真实应用范围。其中,分类函数是由对至少两个有监督物联卡的周期数据进行有监督训练得到,有监督物联卡是指对应的标注应用范围已确认正确的物联卡,有监督物联卡可预先指定,也可通过其他方式得到。值得说明的是,有监督训练是指对已知输入和已知输出的样本进行训练,从而得到分类函数,该分类函数表征输入和输出之间的相关关系,在得到新的已知输入而未知输出的样本时,便可根据有监督训练得到的分类函数来预测该样本的输出。在对有监督物联卡的周期数据进行有监督训练时,将周期数据作为已知输入,将周期数据中的标注应用范围作为已知输出,相当于将已确认正确的标注应用范围作为有监督物联卡的预测应用范围,具体训练过程在后文进行详细阐述。

    一种实现方式中,根据分类函数对归一化后的周期数据进行计算得到预测应用范围。由于周期数据内的不同数据可能对应不同的数值单位,故在本发明实施例中,可对周期数据进行归一化处理,去除周期数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的数据能够进行计算和比较,便于后续分析,本发明实施例对归一化处理的具体方式不做限定,如可通过sigmoid函数对周期数据进行映射。

    在s103中,若所述待测物联卡的所述标注应用范围与所述预测应用范围不符,则将所述待测物联卡确定为异常物联卡。

    若得到的待测物联卡的标注应用范围与预测应用范围不符,如待测物联卡的标注应用范围是共享单车行业,预测应用范围是智慧路灯行业,则将待测物联卡确定为异常物联卡。值得说明的是,可由服务器实现上述的物联卡应用范围的确定方法实施例,另外,对于确定出的异常物联卡,可由服务器对其执行监管操作,如关停异常物联卡的账号或对异常物联卡的发放对象进行警告等,本发明实施例对具体的监管操作不做限定。

    通过图1所示实施例可知,在本发明实施例中,确定待测物联卡在设定周期内的周期数据,根据分类函数对周期数据进行计算得到预测应用范围,若待测物联卡的标注应用范围与预测应用范围不符,则将待测物联卡确定为异常物联卡,本发明实施例通过有监督训练得到的分类函数对待测物联卡进行应用范围预测,从而确定应用范围异常的物联卡,提升了物联卡的监管效果,利于物联网的良性发展。

    图2所示,是本发明实施例提供的对至少两个所述有监督样本进行训练得到分类函数的实现流程图,如图2所示,可以包括以下步骤:

    在s201中,基于有监督物联卡的所述周期数据及所述周期数据中的所述标注应用范围构建有监督样本,基于至少两个所述有监督样本构建有监督样本集。

    为了通过有监督训练得到分类函数,在本步骤中,构建有监督训练所需的样本,具体地,基于有监督物联卡的周期数据及周期数据中的标注应用范围构建有监督样本。为了保证有监督训练的训练效果,限定构建至少两个有监督样本,基于至少两个所述有监督样本构建有监督样本集,且限定有监督样本集对应的标注应用范围为至少两种。为了便于理解,假设有监督样本集内的有监督样本为(xi,yi),则xi为第i个有监督样本的周期数据,yi为第i个有监督样本的标注应用范围,相当于将第i个有监督样本的标注应用范围作为该有监督样本已知的预测应用范围。

    在s202中,选取所述有监督样本集对应的一个所述标注应用范围,将所述标注应用范围作为分类条件对所述有监督样本集进行二分类,根据目标训练策略对二分类得到的两个已分类样本集进行训练得到分类函数,直到每个所述已分类样本集仅对应一个所述标注应用范围为止。

    在有监督训练过程中,选取有监督样本集对应的一个标注应用范围,将该标注应用范围作为分类条件对有监督样本集进行二分类,为了便于区分,将二分类得到的样本集均命名为已分类样本集。根据目标训练策略对二分类得到的两个已分类样本集进行训练得到分类函数,然后选取已分类样本集对应的一个标注应用范围,将选取的标注应用范围作为分类条件对已分类样本集进行二分类,重复上述过程直到每个已分类样本集仅对应一个标注应用范围为止。目标训练策略可预先指定,如指定为逻辑回归(logisticregression,lr)策略、随机森林(randomforest,rf)策略或支持向量机(supportvectormachine,svm)策略等。

    为了便于说明上述的二分类过程,本发明实施例提供了如图3所示的分类示意图,在图3中,假设有监督样本集对应k种标注应用范围,将有监督样本集中各标注应用范围对应的有监督样本单独归入一个样本集,对标注应用范围进行排序得到[第1个标注应用范围,……,第k个标注应用范围],按照标注应用范围的顺序对各样本集进行排序,得到[样本集1,……,样本集k],其中,对标注应用范围进行的排序可为随机排序,k为大于2的整数,j、m及n均为大于零且小于k的整数。在选取了有监督样本集对应的一个标注应用范围后,将该标注应用范围对应的且该标注应用范围之前的标注应用范围对应的样本集统一作为一个已分类样本集,将其余的样本集统一作为另一个已分类样本集,如在图3中,选取出的有监督样本集对应的标注应用范围为j,则将[样本集1,……,样本集j]统一作为一个已分类样本集,将[样本集j 1,……,样本集k]统一作为另一个已分类样本集,根据目标训练策略对两个已分类样本集进行训练后得到分类函数1。其中,在选取样本集对应的标注应用范围时可随机选取或指定选取,若选取出的标注应用范围不支持对样本集进行二分类,则选取样本集对应的另外的标注应用范围。由于对有监督样本集或对已分类样本集进行二分类后,会得到一个与有监督样本集或已分类样本集对应的分类函数,故在完成上述的分类及训练过程后,最终得到k-1个分类函数。

    另外,在根据k-1个分类函数对待测物联卡的周期数据进行计算时,参照图3,首先根据有监督样本集对应的分类函数1计算待测物联卡的预测应用范围是属于[1,……,j]一类还是属于[j 1,……,k]一类,若计算出待测物联卡的预测应用范围是属于[1,……,j]一类,则根据[样本集1,……,样本集j]对应的分类函数2继续对待测物联卡的预测应用范围进行计算,重复上述过程直到最终计算出的预测应用范围仅所属一个标注应用范围,将该标注应用范围确定为待测物联卡的预测应用范围。

    通过图2所示实施例可知,在本发明实施例中,基于至少两个有监督物联卡的周期数据及标注应用范围构建有监督样本集,对有监督样本集不断进行二分类,根据目标训练策略对二分类得到的两个已分类样本集进行训练得到分类函数,直到每个已分类样本集仅对应一个标注应用范围为止,本发明实施例通过对至少两个有监督样本进行有监督训练,提升了分类函数的准确性。

    图4所示,是本发明实施例提供的确定目标训练策略的实现流程图,如图4所示,可以包括以下步骤:

    在s401中,将所述有监督样本集划分为训练样本集和验证样本集。

    为了使目标训练策略的训练效果达到最优,在本发明实施例中,将有监督样本集划分为训练样本集和验证样本集。优选地,训练样本集内有监督样本的数量大于验证样本集内有监督样本的数量,如可将有监督样本集中80%的有监督样本划分至训练样本集,将剩余的20%的有监督样本划分至验证样本集。

    在s402中,设定至少两种候选训练策略,选取所述训练样本集对应的一个所述标注应用范围,将所述标注应用范围作为分类条件对所述训练样本集进行二分类,根据所述候选训练策略对二分类得到的两个已分类样本集进行训练得到候选分类函数,直到每个所述已分类样本集仅对应一个所述标注应用范围为止。

    设定至少两种候选训练策略,如设定lr策略、rf策略及svm策略三种候选训练策略,其中,lr策略擅长处理多指标连续性变量,rf策略擅长处理多指标离散性变量,svm策略擅长处理多指标少样本变量。为了判断哪种候选训练策略最擅长处理本发明实施例中的周期数据,对于每种候选训练策略,选取训练样本集对应的一个标注应用范围,将标注应用范围作为分类条件对训练样本集进行二分类,根据候选训练策略对二分类得到的两个已分类样本集进行训练得到候选分类函数,再选取已分类样本集对应的一个标注应用范围,将标注应用范围作为分类条件对已分类样本集进行二分类,重复上述过程直到每个已分类样本集仅对应一个标注应用范围为止。最终,得到每种候选训练策略对应的候选分类函数。

    在s403中,根据所述验证样本集对所述候选分类函数进行验证得到所述候选训练策略对应的准确率,将最大的所述准确率所对应的所述候选训练策略确定为目标训练策略。

    根据验证样本集对候选分类函数进行验证得到候选训练策略对应的准确率,具体将验证样本集内有监督样本中的周期数据输入至候选分类函数,并判断候选分类函数的输出是否与有监督样本中的标注应用范围相同,若相同,则判定该有监督样本验证成功。然后,将验证成功的有监督样本的数量与验证样本集内有监督样本的总数量之间的比值确定为候选训练策略对应的准确率。按照上述方式得到各候选训练策略对应的准确率后,将最大的准确率所对应的候选训练策略确定为目标训练策略,则该目标训练策略最适于处理有监督样本集内的有监督样本。

    通过图4所示实施例可知,在本发明实施例中,将有监督样本集划分为训练样本集和验证样本集,设定至少两种候选训练策略,根据候选训练策略对训练样本集进行训练得到候选分类函数,根据验证样本集对候选分类函数进行验证得到候选训练策略对应的准确率,将最大的准确率所对应的候选训练策略确定为目标训练策略,本发明实施例通过在至少两种候选训练策略中选取最适于有监督样本集的目标训练策略,提升了后续进行有监督训练的准确性。

    图5所示,是本发明实施例提供的确定有监督样本的实现流程图,如图5所示,可以包括以下步骤:

    在s501中,确定与至少两种所述标注应用范围对应的初始物联卡,将所述初始物联卡的所述周期数据确定为初始样本,其中,所述初始物联卡是指对应的所述标注应用范围未被确认是否正确的物联卡。

    在本发明实施例中,确定与至少两种标注应用范围对应的初始物联卡,为了便于区分,将初始物联卡的周期数据命名为初始样本,其中,初始物联卡是指对应的标注应用范围未被确认是否正确的物联卡。

    一种实现方式中,根据标注应用范围对应的初始物联卡数量确定周期数量,周期数量指示设定周期的数量,根据周期数量确定该标注应用范围对应的初始物联卡的周期数据,将周期数据确定为初始样本。由于不同标注应用范围发放的初始物联卡的初始物联卡数量可能不同,故可根据标注应用范围对应的初始物联卡数量确定周期数量,根据周期数量确定该标注应用范围对应的初始物联卡的周期数据,将周期数据确定为初始样本,从而均衡不同标注应用范围对应的初始样本的数量。举例来说,标注应用范围a的初始物联卡数量为100张,标注应用范围b的初始物联卡数量为200张,故可根据初始物联卡数量之间的比例确定出周期数量,比如可将标注应用范围a的周期数量确定为2,将标注应用范围b的周期数量确定为1,则在确定周期数据时,对于标注应用范围a对应的各初始物联卡,确定初始物联卡在2个设定周期的周期数据,从而确定出2个初始样本;对于标注应用范围b对应的各初始物联卡,确定初始物联卡在1个设定周期的周期数据,从而确定出1个初始样本。如此,最终不同标注应用范围对应的初始样本的数量便可保持一致。值得说明的是,确定初始物联卡在至少两个设定周期的周期数据时,至少两个设定周期可为发生在相同时间的周期,也可为发生在不同时间的周期,比如在设定周期为1天,周期数量为2的情况下,可确定2次初始物联卡在昨天的周期数据,从而构成2个初始样本;也可确定初始物联卡在昨天的周期数据以及在前天的周期数据,从而构成2个初始样本,本发明实施例对此不做限定。通过上述方法,提升了不同标注应用范围对应的初始样本在数量上的均衡性,利于后续进行聚类分析。

    在s502中,对所述标注应用范围对应的所述初始样本进行聚类分析得到至少两个聚类,将包含的所述初始样本数量最多的所述聚类确定为多数类,将所述多数类对应的所述初始物联卡确定为有监督物联卡。

    在本发明实施例中,认定多数初始物联卡的真实应用范围与标注应用范围相符,对于每种标注应用范围,将标注应用范围对应的初始样本进行聚类分析得到至少两个聚类,将包含的初始样本数量最多的聚类确定为多数类,将多数类对应的初始物联卡均确定为有监督物联卡。

    一种实现方式中,计算多数类的质心,确定多数类对应的标注应用范围的设定样本条件,若质心满足设定样本条件,则将多数类对应的初始物联卡确定为有监督物联卡。为了进一步提升确定出的有监督物联卡的准确性,在本发明实施例中,计算得到的多数类的质心,质心即为多数类内所有初始样本的平均样本,如多数类内包括初始样本z1、z2及z3,则该多数类的质心为(z1 z2 z3)/3。确定多数类对应的标注应用范围的设定样本条件,该设定样本条件为设定的该标注应用范围对应的初始物联卡必须满足的条件,如对于为共享单车行业的标注应用范围,设定样本条件可为移动距离大于1千米。若质心满足设定样本条件,则判定该质心所属多数类对应的初始物联卡的标注应用范围是正确的,将该多数类对应的初始物联卡确定为有监督物联卡;若质心不满足设定样本条件,则判定该质心所属多数类对应的初始物联卡的标注应用范围无法确认是否正确,不对该标注应用范围对应的初始物联卡进行处理。

    通过图5所示实施例可知,在本发明实施例中,确定与至少两种标注应用范围对应的初始物联卡,将初始物联卡的周期数据确定为初始样本,对标注应用范围对应的初始样本进行聚类分析得到至少两个聚类,将包含的初始样本数量最多的聚类确定为多数类,将多数类对应的初始物联卡确定为有监督物联卡,本发明实施例在除了人工指定有监督物联卡之外,提供了一种通过聚类分析确定有监督物联卡的方式,提升了确定有监督物联卡的灵活性以及在不同场景下的适用性。

    为了更好地说明本发明实施例的内容,提供了如图6所示的分类函数的应用流程图,在图6中,分类函数可通过对有监督样本进行离线训练得到。并且,由于初始物联卡数量通常会随着时间推移不断增加,故在相隔一定时长后,可在最新得到的初始物联卡中确定出有监督物联卡,从而实现对分类函数的更新。对于s502中多数类之外的聚类对应的初始物联卡,可将该初始物联卡作为待测物联卡,通过分类函数对该初始物联卡的周期数据进行离线存量预测,得到初始物联卡的预测应用范围;当然,也可将新出现的初始物联卡作为待测物联卡,通过分类函数对该初始物联卡的周期数据进行在线增量预测,得到新出现的初始物联卡的预测应用范围。

    图7所示,是本发明实施例提供的对标注应用范围对应的初始样本进行聚类分析得到至少两个聚类的实现流程图,如图7所示,可以包括以下步骤:

    在s701中,根据设定的聚类个数在所述初始样本中选取聚类中心。

    在进行聚类分析时,首先根据设定的聚类个数在初始样本中选取聚类中心,本发明实施例限定聚类个数为至少2个,为了便于说明,后文以聚类个数为2个的情况进行阐述。在根据聚类个数选取聚类中心时,可随机选取初始样本作为聚类中心,也可通过其他方式进行选取,直到聚类中心的数量达到聚类个数为止。值得一提的是,对于每个标注应用范围对应的初始样本,都要单独进行一次聚类分析。

    在s702中,将聚类中心之外的各初始样本确定为候选样本,计算候选样本与聚类中心之间的欧式距离,将最短的欧式距离所对应的候选样本和聚类中心组成聚类。

    为了便于区分,将聚类中心之外的各初始样本确定为候选样本,计算各候选样本与已有的聚类中心之间的欧式距离,将最短的欧式距离所对应的候选样本和聚类中心组成聚类,直到不存在未组成聚类的候选样本为止。

    在s703中,计算所述聚类的质心。

    对于生成的各聚类,计算聚类的质心,质心即为该聚类内的所有初始样本的平均样本。

    在s704中,当所述质心满足设定更新条件时,将所述质心设置为所述聚类的新的所述聚类中心,重新计算候选样本与聚类中心之间的欧式距离,将最短的欧式距离所对应的候选样本和聚类中心组成聚类,直到聚类的聚类中心不再变化为止。

    当计算出的质心满足设定更新条件时,将质心设置为对应聚类的新的聚类中心。假设聚类中原有的聚类中心为η,该聚类的质心为η,则设定更新条件可为η′≠η,且|η′-η|>δ,δ的值可根据实际应用场景进行设置,如可设置为0.1。在更新了聚类中心后,重新计算候选样本与各聚类中心之间的欧式距离,将最短的欧式距离所对应的候选样本与聚类中心组成聚类,即基于聚类中心进行重新聚类,直到不存在未组成聚类的候选样本为止。聚类完成后再计算聚类的质心,判断质心是否满足设定更新条件,重复上述过程直到聚类的聚类中心不再变化为止。

    在s705中,当所述质心不满足所述设定更新条件时,维持所述聚类原有的所述聚类中心。

    当质心不满足设定更新条件时,证明质心与该聚类原有的聚类中心之间的差异较小,则维持聚类原有的聚类中心。

    在s706中,确定聚类中心不再变化的聚类。

    在各聚类的聚类中心不再变化后,确定聚类中心不再变化的聚类。

    通过图7所示实施例可知,在本发明实施例中,根据设定的聚类个数在初始样本中选取聚类中心,将聚类中心之外的各初始样本确定为候选样本,计算候选样本与聚类中心之间的欧式距离,将最短的欧式距离所对应的候选样本和聚类中心组成聚类,根据设定更新条件判断是否对聚类的聚类中心进行更新,最终确定聚类中心不再变化的聚类,本发明实施例根据初始样本的相似程度对初始样本进行聚类,实现了初始样本的类别区分,便于后续确定有监督物联卡。

    为了更好地说明本发明实施例的内容,提供了如图8所示的确定有监督样本的流程图,在图8中,假设已得到的初始样本对应k种标注应用范围,则区分出各标注应用范围对应的初始样本,对各标注应用范围对应的初始样本进行单独进行聚类分析,假设聚类个数为2个,则可将各标注应用范围对应的初始样本归入至多数类或多数类之外的聚类。对于得到的多数类,确定多数类内的初始样本对应的有监督物联卡,将各标注应用范围对应的有监督物联卡联合为最终确定的有监督物联卡。

    应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

    对应于上文实施例所述的物联卡应用范围的确定方法,图9示出了本发明实施例提供的物联卡应用范围的确定装置的结构框图,参照图9,该确定装置包括:

    第一确定单元91,用于确定待测物联卡在设定周期内的周期数据,所述周期数据包括所述待测物联卡对应的标注应用范围,所述标注应用范围为设定的预期应用范围;

    计算单元92,用于根据分类函数对所述周期数据进行计算得到预测应用范围,其中,所述分类函数由对至少两个有监督物联卡的所述周期数据进行有监督训练得到,所述有监督物联卡是指对应的所述标注应用范围已确认正确的物联卡;

    第二确定单元93,用于若所述待测物联卡的所述标注应用范围与所述预测应用范围不符,则将所述待测物联卡确定为异常物联卡。

    一种实现方式中,计算单元92还包括:

    构建单元,用于基于有监督物联卡的所述周期数据及所述周期数据中的所述标注应用范围构建有监督样本,基于至少两个所述有监督样本构建有监督样本集;

    分类单元,用于选取所述有监督样本集对应的一个所述标注应用范围,将所述标注应用范围作为分类条件对所述有监督样本集进行二分类,根据目标训练策略对二分类得到的两个已分类样本集进行训练得到分类函数,直到每个所述已分类样本集仅对应一个所述标注应用范围为止。

    一种实现方式中,分类单元还包括:

    划分单元,用于将所述有监督样本集划分为训练样本集和验证样本集;

    候选分类单元,用于设定至少两种候选训练策略,选取所述训练样本集对应的一个所述标注应用范围,将所述标注应用范围作为分类条件对所述训练样本集进行二分类,根据所述候选训练策略对二分类得到的两个已分类样本集进行训练得到候选分类函数,直到每个所述已分类样本集仅对应一个所述标注应用范围为止;

    策略确定单元,用于根据所述验证样本集对所述候选分类函数进行验证得到所述候选训练策略对应的准确率,将最大的所述准确率所对应的所述候选训练策略确定为目标训练策略。

    一种实现方式中,构建单元还包括:

    初始样本确定单元,用于确定与至少两种所述标注应用范围对应的初始物联卡,将所述初始物联卡的所述周期数据确定为初始样本,其中,所述初始物联卡是指对应的所述标注应用范围未被确认是否正确的物联卡;

    聚类单元,用于对所述标注应用范围对应的所述初始样本进行聚类分析得到至少两个聚类,将包含的所述初始样本数量最多的所述聚类确定为多数类,将所述多数类对应的所述初始物联卡确定为有监督物联卡。

    一种实现方式中,聚类单元包括:

    中心选取单元,用于根据设定的聚类个数在所述初始样本中选取聚类中心;

    距离计算单元,用于将聚类中心之外的各初始样本确定为候选样本,计算候选样本与聚类中心之间的欧式距离,将最短的欧式距离所对应的候选样本和聚类中心组成聚类;

    质心计算单元,用于计算所述聚类的质心;

    中心选取单元,用于当所述质心满足设定更新条件时,将所述质心设置为所述聚类的新的所述聚类中心,重新计算候选样本与聚类中心之间的欧式距离,将最短的欧式距离所对应的候选样本和聚类中心组成聚类,直到聚类的聚类中心不再变化为止;

    维持单元,用于当所述质心不满足所述设定更新条件时,维持所述聚类原有的所述聚类中心;

    聚类确定单元,用于确定聚类中心不再变化的聚类。

    一种实现方式中,初始样本确定单元包括:

    周期数量确定单元,用于根据所述标注应用范围对应的初始物联卡数量确定周期数量,所述周期数量指示所述设定周期的数量;

    初始样本确定子单元,用于根据所述周期数量确定所述标注应用范围对应的所述初始物联卡的所述周期数据,将所述周期数据确定为初始样本。

    一种实现方式中,聚类单元包括:

    条件确定单元,用于计算所述多数类的质心,确定所述多数类对应的所述标注应用范围的设定样本条件;

    有监督物联卡确定单元,用于若所述质心满足所述设定样本条件,则将所述多数类对应的所述初始物联卡确定为有监督物联卡。

    因此,本发明实施例提供的物联卡应用范围的确定装置通过有监督训练得到的分类函数对待测物联卡进行应用范围预测,从而确定应用范围异常的物联卡,提升了物联卡的监管效果,促进物联网的良性发展。

    图10是本发明实施例提供的物联卡应用范围的确定装置的示意图。如图10所示,该实施例的物联卡应用范围的确定装置10包括:处理器100、存储器101以及存储在所述存储器101中并可在所述处理器100上运行的计算机程序102,例如物联卡应用范围的确定程序。所述处理器100执行所述计算机程序102时实现上述各个物联卡应用范围的确定方法实施例中的步骤,例如图1所示的s101至s103。或者,所述处理器100执行所述计算机程序102时实现上述各物联卡应用范围的确定装置实施例中各单元的功能,例如图9所示单元91至93的功能。

    示例性的,所述计算机程序102可以被分割成一个或多个单元,所述一个或者多个单元被存储在所述存储器101中,并由所述处理器100执行,以完成本发明。所述一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序102在所述物联卡应用范围的确定装置10中的执行过程。例如,所述计算机程序102可以被分割成第一确定单元、计算单元及第二确定单元,各单元具体功能如下:

    第一确定单元,用于确定待测物联卡在设定周期内的周期数据,所述周期数据包括所述待测物联卡对应的标注应用范围,所述标注应用范围为设定的预期应用范围;

    计算单元,用于根据分类函数对所述周期数据进行计算得到预测应用范围,其中,所述分类函数由对至少两个有监督物联卡的所述周期数据进行有监督训练得到,所述有监督物联卡是指对应的所述标注应用范围已确认正确的物联卡;

    第二确定单元,用于若所述待测物联卡的所述标注应用范围与所述预测应用范围不符,则将所述待测物联卡确定为异常物联卡。

    所述物联卡应用范围的确定装置10可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述物联卡应用范围的确定装置可包括,但不仅限于,处理器100、存储器101。本领域技术人员可以理解,图10仅仅是物联卡应用范围的确定装置10的示例,并不构成对物联卡应用范围的确定装置10的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述物联卡应用范围的确定装置还可以包括输入输出设备、网络接入设备、总线等。

    所称处理器100可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

    所述存储器101可以是所述物联卡应用范围的确定装置10的内部存储单元,例如物联卡应用范围的确定装置10的硬盘或内存。所述存储器101也可以是所述物联卡应用范围的确定装置10的外部存储设备,例如所述物联卡应用范围的确定装置10上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,所述存储器101还可以既包括所述物联卡应用范围的确定装置10的内部存储单元也包括外部存储设备。所述存储器101用于存储所述计算机程序以及所述物联卡应用范围的确定装置所需的其他程序和数据。所述存储器101还可以用于暂时地存储已经输出或者将要输出的数据。

    所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元完成,即将所述物联卡应用范围的确定装置的内部结构划分成不同的功能单元,以完成以上描述的全部或者部分功能。实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

    在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

    本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

    在本发明所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。

    所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

    另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

    所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。

    以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。


    技术特征:

    1.一种物联卡应用范围的确定方法,其特征在于,包括:

    确定待测物联卡在设定周期内的周期数据,所述周期数据包括所述待测物联卡对应的标注应用范围,所述标注应用范围为设定的预期应用范围;

    根据分类函数对所述周期数据进行计算得到预测应用范围,其中,所述分类函数由对至少两个有监督物联卡的所述周期数据进行有监督训练得到,所述有监督物联卡是指对应的所述标注应用范围已确认正确的物联卡;

    若所述待测物联卡的所述标注应用范围与所述预测应用范围不符,则将所述待测物联卡确定为异常物联卡。

    2.如权利要求1所述的确定方法,其特征在于,所述根据分类函数对所述周期数据进行计算得到预测应用范围之前,还包括:

    基于有监督物联卡的所述周期数据及所述周期数据中的所述标注应用范围构建有监督样本,基于至少两个所述有监督样本构建有监督样本集;

    选取所述有监督样本集对应的一个所述标注应用范围,将所述标注应用范围作为分类条件对所述有监督样本集进行二分类,根据目标训练策略对二分类得到的两个已分类样本集进行训练得到分类函数,直到每个所述已分类样本集仅对应一个所述标注应用范围为止。

    3.如权利要求2所述的确定方法,其特征在于,所述选取所述有监督样本集对应的一个所述标注应用范围之前,还包括:

    将所述有监督样本集划分为训练样本集和验证样本集;

    设定至少两种候选训练策略,选取所述训练样本集对应的一个所述标注应用范围,将所述标注应用范围作为分类条件对所述训练样本集进行二分类,根据所述候选训练策略对二分类得到的两个已分类样本集进行训练得到候选分类函数,直到每个所述已分类样本集仅对应一个所述标注应用范围为止;

    根据所述验证样本集对所述候选分类函数进行验证得到所述候选训练策略对应的准确率,将最大的所述准确率所对应的所述候选训练策略确定为目标训练策略。

    4.如权利要求2所述的确定方法,其特征在于,所述基于有监督物联卡的所述周期数据及所述周期数据中的所述标注应用范围构建有监督样本之前,还包括:

    确定与至少两种所述标注应用范围对应的初始物联卡,将所述初始物联卡的所述周期数据确定为初始样本,其中,所述初始物联卡是指对应的所述标注应用范围未被确认是否正确的物联卡;

    对所述标注应用范围对应的所述初始样本进行聚类分析得到至少两个聚类,将包含的所述初始样本数量最多的所述聚类确定为多数类,将所述多数类对应的所述初始物联卡确定为有监督物联卡。

    5.如权利要求4所述的确定方法,其特征在于,所述对所述标注应用范围对应的所述初始样本进行聚类分析得到至少两个聚类,包括:

    根据设定的聚类个数在所述初始样本中选取聚类中心;

    将聚类中心之外的各初始样本确定为候选样本,计算候选样本与聚类中心之间的欧式距离,将最短的欧式距离所对应的候选样本和聚类中心组成聚类;

    计算所述聚类的质心;

    当所述质心满足设定更新条件时,将所述质心设置为所述聚类的新的所述聚类中心,重新计算候选样本与聚类中心之间的欧式距离,将最短的欧式距离所对应的候选样本和聚类中心组成聚类,直到聚类的聚类中心不再变化为止;

    当所述质心不满足所述设定更新条件时,维持所述聚类原有的所述聚类中心;

    确定聚类中心不再变化的聚类。

    6.如权利要求4所述的确定方法,其特征在于,所述将所述初始物联卡的所述周期数据确定为初始样本,包括:

    根据所述标注应用范围对应的初始物联卡数量确定周期数量,所述周期数量指示所述设定周期的数量;

    根据所述周期数量确定所述标注应用范围对应的所述初始物联卡的所述周期数据,将所述周期数据确定为初始样本。

    7.如权利要求4所述的确定方法,其特征在于,所述将所述多数类对应的所述初始物联卡确定为有监督物联卡,包括:

    计算所述多数类的质心,确定所述多数类对应的所述标注应用范围的设定样本条件;

    若所述质心满足所述设定样本条件,则将所述多数类对应的所述初始物联卡确定为有监督物联卡。

    8.一种物联卡应用范围的确定装置,其特征在于,包括:

    第一确定单元,用于确定待测物联卡在设定周期内的周期数据,所述周期数据包括所述待测物联卡对应的标注应用范围,所述标注应用范围为设定的预期应用范围;

    计算单元,用于根据分类函数对所述周期数据进行计算得到预测应用范围,其中,所述分类函数由对至少两个有监督物联卡的所述周期数据进行有监督训练得到,所述有监督物联卡是指对应的所述标注应用范围已确认正确的物联卡;

    第二确定单元,用于若所述待测物联卡的所述标注应用范围与所述预测应用范围不符,则将所述待测物联卡确定为异常物联卡。

    9.一种物联卡应用范围的确定装置,其特征在于,所述确定装置包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如下步骤:

    确定待测物联卡在设定周期内的周期数据,所述周期数据包括所述待测物联卡对应的标注应用范围,所述标注应用范围为设定的预期应用范围;

    根据分类函数对所述周期数据进行计算得到预测应用范围,其中,所述分类函数由对至少两个有监督物联卡的所述周期数据进行有监督训练得到,所述有监督物联卡是指对应的所述标注应用范围已确认正确的物联卡;

    若所述待测物联卡的所述标注应用范围与所述预测应用范围不符,则将所述待测物联卡确定为异常物联卡。

    10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述确定方法的步骤。

    技术总结
    本发明提供了物联卡应用范围的确定方法、装置及计算机可读存储介质,其中所述确定方法包括:确定待测物联卡在设定周期内的周期数据,所述周期数据包括所述待测物联卡对应的标注应用范围,所述标注应用范围为设定的预期应用范围;根据分类函数对所述周期数据进行计算得到预测应用范围,其中,所述分类函数由对至少两个有监督物联卡的所述周期数据进行有监督训练得到,所述有监督物联卡是指对应的所述标注应用范围已确认正确的物联卡;若所述待测物联卡的所述标注应用范围与所述预测应用范围不符,则将所述待测物联卡确定为异常物联卡。本发明提升了物联卡的监管效果,利于物联网的良性发展。

    技术研发人员:吕笑笑;闫伟
    受保护的技术使用者:中移(苏州)软件技术有限公司;中国移动通信集团有限公司
    技术研发日:2019.09.12
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-19140.html

    最新回复(0)