本发明涉及数据分析领域,尤其涉及一种行为识别方法、装置及计算机存储介质。
背景技术:
人体行为识别技术是模式识别与人工智能领域内的一个研究方向,具有广泛的应用场景。早期的研究工作为了能够获取准确全面的人体运动信息,使用多个加速度传感器固定在人身体的不同部位同步进行数据采集,从而在一定程度上提高了系统的识别率,但使用者的舒适度和便利性并不佳;而且随着传感器数量的增加,系统的制造成本和数据的运算成本也会增加。
随着智能手机的发展,可以通过手机内部传感器采集的各种数据,用于表征用户的日常行为信息,可广泛应用于行为模式识别。但目前已有的行为识别方法,行为识别准确性仍然较低,应用方面还存在着诸多不足。
技术实现要素:
有鉴于此,本发明实施方式提供一种准确率更高的行为识别方法、装置及计算机存储介质。
本发明实施方式的技术方案是这样实现的:
第一方面,本发明实施方式提供行为识别方法,所述方法包括:获取设置的多个频段内的样本行为数据,根据各所述频段内的所述样本行为数据对应的频率特征分别确定对应的第一特征向量,形成第一特征向量集合;
基于所述第一特征向量集合分别对所述第一特征向量进行筛选,选取所述第一特征向量的部分频率特征作为初始的目标子集,根据所述目标子集的编码对应的适应度值、以及另一部分频率特征对应的其它子集的编码进行交叉编码后的适应度值对所述目标子集进行更新,根据更新后的所述目标子集确定对所述第一特征向量筛选后的第二特征向量,形成第二特征向量集合;
确定所述第二特征向量集合中各所述第二特征向量与样本行为类别的映射关系,根据所述映射关系建立行为识别模型。
可选地,所述获取设置的多个频段内的样本行为数据之前,包括:
获取用于表征样本行为的三轴加速度数据,对所述加速度数据进行频域分析,根据频域分析后的所述加速度数据的频率分布确定分别与不同样本行为类别对应的频段。
可选地,所述根据各所述频段内的所述样本行为数据对应的频率特征分别确定对应的第一特征向量,包括:
根据各所述频段内的所述样本行为数据对应的如下至少其中之一频率特征:最大值、最小值、中间值、均值、范围、方差、主系数和、均方根、协方差系数、信号幅度区域、信号向量幅度和直流分量;
分别确定与所述各频段对应的第一特征向量。
可选地,所述选取所述第一特征向量的部分频率特征作为初始的目标子集,根据所述目标子集的编码对应的适应度值、以及另一部分频率特征对应的其它子集的编码进行交叉编码后的适应度值对所述目标子集进行更新,根据更新后的所述目标子集确定对所述第一特征向量筛选后的第二特征向量,包括:
将所述第一特征向量中频率特征进行编码,选择m个频率特征作为初始的目标子集,其中m≥1;将剩余子集进行交叉编码,得到新的特征集合,根据所述目标子集和所述新的特征集合分别对应的适应度值对所述目标子集进行更新;
确定所述目标子集符合设定条件时,则根据更新后的所述目标子集确定所述第一特征向量筛选后的第二特征向量。
可选地,所述将剩余子集进行交叉编码之前,包括:
根据所述初始的目标子集中各子集的适应度值,确定适应度值符合设置范围的一个或多个子集为目标子集。
可选地,所述确定所述目标子集符合设定条件,包括如下至少之一:
确定进行交叉编码的次数满足预设条件时,则确定所述目标子集符合设定条件;
确定交叉编码后符合收敛条件时,则确定所述目标子集符合设定条件。
可选地,还包括:确定所述目标子集不符合所述设定条件时,根据所述新的特征集合重新选择目标子集,并返回所述根据所述初始群体中剩余子集进行交叉编码的步骤。
可选地,所述确定所述第二特征向量集合中各所述第二特征向量与样本行为类别的映射关系,包括:
根据所述第二特征向量集合中各所述第二特征向量包含的频率特征,确定分别与各所述频段对应的分类节点;
基于所述分类节点与各所述频段对应的样本行为类别,建立所述第二特征向量集合中各所述第二特征向量与样本行为类别的映射关系。
可选地,所述确定分别与各所述频段对应的分类节点,包括:
构建树形结构的识别分类器,所述识别分类器的分类节点由所述第二特征向量集合中各所述第二特征向量包含的频率特征组成;
确定所述分类节点的信息熵和条件熵,得到分叉时的信息增益,根据所述信息增益的大小确定所述分类节点以及所述分类节点在所述识别分类器中的位置。
第二方面,本发明实施方式还提供了一种行为识别装置,所述装置包括:特征提取模块、特征优选模块和模型建立模块,其中,
所述特征提取模块,用于获取设置的多个频段内的样本行为数据,根据各所述频段内的所述样本行为数据对应的频率特征分别确定对应的第一特征向量,形成第一特征向量集合;
所述特征优选模块,用于基于所述第一特征向量集合分别对所述第一特征向量进行筛选,选取所述第一特征向量的部分频率特征作为初始的目标子集,根据所述目标子集的编码对应的适应度值、以及另一部分频率特征对应的其它子集的编码进行交叉编码后的适应度值对所述目标子集进行更新,根据更新后的所述目标子集确定对所述第一特征向量筛选后的第二特征向量,形成第二特征向量集合;
所述模型建立模块,用于确定所述第二特征向量集合中各所述第二特征向量与样本行为类别的映射关系,根据所述映射关系建立行为识别模型。
第三方面,本发明实施方式还提供了一种行为识别装置,其特征在于,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器;其中,所述处理器用于运行所述计算机程序时,实现本发明任一实施方式所述的行为识别方法。
第四方面,本发明实施方式还提供了一种计算机存储介质,所述计算机存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现本发明任一实施方式所述的行为识别。
本发明上述实施方式所提供的行为识别方法、装置及计算机存储介质,通过获取设置的多个频段内的样本行为数据,根据各所述频段内的所述样本行为数据对应的频率特征分别确定对应的第一特征向量,形成第一特征向量集合;如此,在预处理阶段根据行为数据在频域进行分析,提取出适用于区分行为的频率特征信息。基于所述第一特征向量集合分别对所述第一特征向量进行筛选,选取所述第一特征向量的部分频率特征作为初始的目标子集,根据所述目标子集的编码对应的适应度值、以及另一部分频率特征对应的其它子集的编码进行交叉编码后的适应度值对所述目标子集进行更新,根据更新后的所述目标子集确定对所述第一特征向量筛选后的第二特征向量,形成第二特征向量集合;如此,进行特征优选,对特征信息进行降维,保留分类正确率较高的特征,减小运算的复杂度,并且保证了行为识别的准确率。确定所述第二特征向量集合中各所述第二特征向量与样本行为类别的映射关系,根据所述映射关系建立行为识别模型;如此,利用提取的特征与特征已知的对应行为,确定行为与特征的映射关系,得到行为识别模型。由此实现了一种新的行为识别方法,可以有效的提高行为识别的准确率。
附图说明
图1为本发明一实施方式提供的行为识别方法的流程示意图;
图2为本发明另一实施方式特征优选的流程示意图;
图3为本发明又一实施方式特征优选的流程示意图;
图4为本发明一实施方式提供的识别分类器的结构示意图;
图5为本发明一实施方式提供的行为识别装置的结构示意图;
图6为本发明另一实施方式提供的行为识别装置的结构示意图;
图7为本发明又一实施方式提供的行为识别装置的结构示意图。
具体实施方式
以下结合说明书附图及具体实施方式对本发明技术方案做进一步的详细阐述。除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施方式的目的,不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
如图1所示,本发明一实施方式提供了一种行为识别方法,该方法包括如下步骤:
步骤s11:获取设置的多个频段内的样本行为数据,根据各所述频段内的所述样本行为数据对应的频率特征分别确定对应的第一特征向量,形成第一特征向量集合。
通常某一类具体行为的频率会集中在某个频段范围内,如上楼行为集中在1.5-2.5hz,跑步频率主要处于2-3hz,行走频率主要处于1-2hz等。获取某一个具体频段内的样本行为及其频率数据,如选取1-2hz内的样本行为,对该频段范围的多个样本行为进行频域分析,确定各个样本行为的频率特征,如最大值、最小值等,多个频率特征组成特征向量,即第一特征向量,由全部第一特征向量的组合形成第一特征向量集合。
步骤s12:基于所述第一特征向量集合分别对所述第一特征向量进行筛选,选取所述第一特征向量的部分频率特征作为初始的目标子集,根据所述目标子集的编码对应的适应度值、以及另一部分频率特征对应的其它子集的编码进行交叉编码后的适应度值对所述目标子集进行更新,根据更新后的所述目标子集确定对所述第一特征向量筛选后的第二特征向量,形成第二特征向量集合。
这里,由于组合出的第一特征向量集合可能会产生高维特征集合,部分特征可能是多余特征,对后续模型分类识别精确度造成影响,或者增大模型训练的复杂度,增加模型分类训练识别的计算量。通过选取第一特征向量的部分频率特征作为初始的目标子集,再根据所述目标子集的编码对应的适应度值、以及另一部分频率特征对应的其它子集的编码进行交叉编码后的适应度值对所述目标子集进行更新,根据更新后的所述目标子集确定对所述第一特征向量筛选后的第二特征向量。由此将第一特征向量进行降维筛选,解决了特征选择最优化问题,在保留分类正确率较高的特征的同时,提高识别精确度并降低运算复杂度,选出第二特征向量,即为优选特征向量,由第二特征向量组合形成第二特征向量集合。
步骤s13:确定所述第二特征向量集合中各所述第二特征向量与样本行为类别的映射关系,根据所述映射关系建立行为识别模型。
这里,对特征向量进行优选后,即得到用于建立识别模型的第二特征向量集合,第二特征向量中同样包含多个频率特征,每一个第二特征向量中的频率特征对应于识别模型中的识别分类点,利用提取的第二特征向量集合与其对应的已知的样本行为类别,确定行为类别与第二特征向量集合之间的映射关系,最终建立完整的行为识别模型。
上述实施例中,通过获取设置的多个频段内的样本行为数据,根据各所述频段内的所述样本行为数据对应的频率特征分别确定对应的第一特征向量,形成第一特征向量集合;如此,对频段范围内的样本行为进行分解,获得适用于区分样本行为的特征信息。再通过基于所述第一特征向量集合分别对所述第一特征向量进行筛选,选取所述第一特征向量的部分频率特征作为初始的目标子集,根据所述目标子集的编码对应的适应度值、以及另一部分频率特征对应的其它子集的编码进行交叉编码后的适应度值对所述目标子集进行更新,根据更新后的所述目标子集确定对所述第一特征向量筛选后的第二特征向量,形成第二特征向量集合;如此,对特征信息进行降维,减小了运算的复杂度,并且保证了行为识别的准确率。最后通过确定所述第二特征向量集合中各所述第二特征向量与样本行为类别的映射关系,根据所述映射关系建立行为识别模型。由此实现了一种新的行为识别方法,可以有效地提高行为识别的准确率并且降低模型训练的复杂程度。
在一实施方式中,所述获取设置的多个频段内的样本行为数据之前,包括:
获取用于表征样本行为的三轴加速度数据,对所述加速度数据进行频域分析,根据频域分析后的所述加速度数据的频率分布确定分别与不同样本行为类别对应的频段。
如前所述,通常,上楼行为集中在1.5-2.5hz,跑步频率主要处于2-3hz,行走频率主要处于1-2hz等。在获取样本行为数据前,可以针对样本行为进行预处理,即通过频域分析,将样本行为按照频段进行区分。具体地,如通过手机传感器采集的三轴加速度数据作为样本数据,可以将样本数据划分在包括0-1hz、0.5-1.5hz、1-2hz、1.5-2.5hz、2-3hz、2.5-3.5hz和3-4hz共7个不同频段范围内,包括站立、行走、跑步、上楼、下楼等人体行为。
在一实施方式中,所述根据各所述频段内的所述样本行为数据对应的频率特征分别确定对应的第一特征向量,包括:根据各所述频段内的所述样本行为数据对应的如下至少其中之一频率特征:最大值、最小值、中间值、均值、范围、方差、主系数和、均方根、协方差系数、信号幅度区域、信号向量幅度和直流分量;分别确定与所述各频段对应的第一特征向量。
在这里,一个特征向量由多个频率特征组合而成,具体的,频率特征可以包括:最大值max,最小值min,中间值med,均值mean,范围range,方差var,主系数和sum,均方根rms,协方差系数(信号沿x轴和y轴的协方差与它们标准差的比率),信号幅度区域sma,信号向量幅度svm,直流分量dc。其中,信号幅度区域sma和信号向量幅度svm可以通过如下公式进行计算:
在一实施方式中,请结合参阅图2,所述选取所述第一特征向量的部分频率特征作为初始的目标子集,根据所述目标子集的编码对应的适应度值、以及另一部分频率特征对应的其它子集的编码进行交叉编码后的适应度值对所述目标子集进行更新,根据更新后的所述目标子集确定对所述第一特征向量筛选后的第二特征向量,包括:
s201:将所述第一特征向量中频率特征进行编码,选择m个频率特征作为初始的目标子集,其中m≥1;将剩余子集进行交叉编码,得到新的特征集合,根据所述目标子集和所述新的特征集合分别对应的适应度值对所述目标子集进行更新;
s202:确定所述目标子集符合设定条件时,则根据更新后的所述目标子集确定所述第一特征向量筛选后的第二特征向量。
在这里,确定第一特征向量集合后,将所述第一特征向量中频率特征进行编码,选择m个频率特征作为初始的目标子集,其中m≥1;然后将剩余子集进行交叉编码,得到新的特征集合。所谓交叉是指把两个父代个体的部分结构加以替换重组而生成新个体的操作。根据编码表示方法的不同,可以有以下的算法:a、实值重组:离散重组、中间重组、线性重组、扩展线性重组等;b、二进制交叉:单点交叉、多点交叉、均匀交叉、洗牌交叉、缩小代理交叉等。分别计算初始目标子集以及新的特征集合对应的适应度值,对目标子集进行更新。
当目标子集更新后,判断目标子集是否符合设定的条件,符合停止条件时,此时的目标子集即为最终的目标子集;当不符合停止条件时,将重复交叉编码并且更新目标子集的操作,直至达到设定条件。
在一实施方式中,所述将剩余子集进行交叉编码之前,包括:
根据所述初始的目标子集中各子集的适应度值,确定适应度值符合设置范围的一个或多个子集为目标子集。
在这里,选择m个频率特征作为初始的目标子集后,计算初始目标子集中对应的适应度值,选择其中一个或者多个适应度值符合设置范围的子集作为目标子集。适应度是用于度量种群中个体优劣的指标,适应度值越高,代表被选择的概率越大。根据适应度选择目标子集,可以筛选出识别率较高的频率特征,淘汰识别率较低的频率特征。
在一实施方式中,所述确定所述目标子集符合设定条件,包括如下至少之一:
确定进行交叉编码的次数满足预设条件时,则确定所述目标子集符合设定条件;
确定交叉编码后符合收敛条件时,则确定所述目标子集符合设定条件。
在这里,对目标子集的设定条件进行了具体设置,也即交叉编码的停止条件,设定条件包括两个。一个是用户设定的交叉编码次数,当达到设定次数时,可以认为目标子集已经符合用户需求,不需要再进行筛选。另一个是交叉编码符合收敛条件,也即再进行交叉编码也无法获得更好的结果,已经达到收敛的边界,此时同样可以认为目标子集已经符合需求。
在一实施方式中,还包括:
确定所述目标子集不符合所述设定条件时,根据所述新的特征集合重新选择目标子集,并返回所述根据所述初始群体中剩余子集进行交叉编码的步骤。
在这里,针对对目标子集不符合设定条件的情况,将根据所述新的特征集合重新选择目标子集,并返回所述根据所述初始群体中剩余子集进行交叉编码的步骤。即回到s201步骤中,重新对剩余子集交叉编码并计算新的适应度值,由此,可以对目标子集不断更新,直至目标子集达到符合设定的条件。
在一实施方式中,如图3所示,为又一实施方式特征优选的流程示意图,同样基于遗传算法的特征选择方法,选用决策树模型为评价函数进行特征降维,包括s301步骤产生初始群体,根据特征数目初始化种群规模,选取一定数量特征集合作为候选解,使用二进制01编码各个特征,每种特征组合即为一个个体染色体或基因。然后进入s302逻辑判断,判断是否满足停止准则,其中s302的停止准则可以为收敛或者达到预设次数。当不满足停止准则时,则进入s303对初始群体中的染色体或者基因计算个体适应度值,计算出个体适应度值后,从中选中3个评价函数评价度最高的染色体,即行为识别正确率较高特征集。其余染色体进入s304轮赌盘选择,具体地,包括采用评价函数f(n)用于评价某个染色体,即某组样本数据特征集合的行为识别准确度,f(n)为第n组样本数据进行识别的准确率。f(n)和f(n)满足如下关系:
其中,m为初始种群的规模。
轮盘赌选择法可用如下过程模拟来实现:
(1)在[0,1]内产生一个均匀分布的随机数r。
(2)若r≤f1,则染色体f(1)被选中。
(3)若fi-1<r≤fi(2≤i≤m),则染色体f(i)被选中。
通过交叉变异获取新染色体特征集进行后续迭代,选择策略采用无放回余数法,选择出较为准确的3组,剩余染色体作为下轮迭代评价初始染色体特征集进入s305和s306步骤,即交叉和变异运算。在这里,交叉和变异是把两个相互配对的染色体依据交叉概率按某种方式相互交换其部分基因,从而形成两个新的个体,如采用双交叉点法,即子代基因在两个交叉点间部分来自一个父代基因,其余部分来自于另外一个父代基因。如交叉前为:01|00|10和11|01|11,则交叉后为:11|00|10和01|01|11。如此进入s307获得新的特征集合,产生新一代群体,并经过k代迭代或者收敛后达到s302的停止准则。达到s302的停止准则后进入s308输出结果并结束。
在一实施方式中,所述确定所述第二特征向量集合中各所述第二特征向量与样本行为类别的映射关系,包括:
根据所述第二特征向量集合中各所述第二特征向量包含的频率特征,确定分别与各所述频段对应的分类节点;
基于所述分类节点与各所述频段对应的样本行为类别,建立所述第二特征向量集合中各所述第二特征向量与样本行为类别的映射关系。
在这里,经过优选后的第二特征向量集合包含了识别正确率较高的频率特征,其中的每一个频率特征对应行为识别分类器中的一个识别分类节点,将所述第二特征向量集合中各所述第二特征向量与样本行为类别一一对应,建立行为类别与第二特征向量的映射关系,如此得到基于行为特征的分类器模型。
在一实施方式中,所述确定分别与各所述频段对应的分类节点,包括:
构建树形结构形式的识别分类器,所述识别分类器的分类节点由所述第二特征向量集合中各所述第二特征向量包含的频率特征组成;
确定所述分类节点的信息熵和条件熵,得到分叉时的信息增益,根据所述信息增益的大小确定所述分类节点以及所述分类节点在所述识别分类器中的位置。
在这里,对经过特征优选后的特征进行行为分类模型训练,分类模型采用树形结构,也即使用决策树作为分类器进行行为识别,其中,决策树的算法包括:id3、c4.5和c5.0等。具体地,将样本集s中每组特征集合数据按照不同的特征v划分到n个类别u1,u2,……,un中,训练过程中的决策树每次分裂均需要计算信息熵、条件熵、信息增益。
(1)计算信息熵,分别用p1,p2,……,pn表示5种行为类别u1,u2,……,un的概率,pi=|ui|/|s|。其中:|ui|表示类别ui中样本集个数,|s|表示总共样本集个数。
计算样本集的信息熵h:
(2)计算条件熵,按样本集特征v进行分类,整个集合就划分为m个子集,记做v1,v2,……,vm,每个子集概率记做p(v1),p(v2),……,p(vm),在每个子集均包含各个行为类别样本,依次计算出各个特征子集信息熵h(vj),p(ui|vj)是特征子集vj中行为ui概率,|vj|指特征子集vj元素总和,|ui|指特征vj中行为种类属于ui的元素个数,
p(ui|vj)=|ui|/|vj|,计算每种特征v条件熵h(v):
(3)计算信息熵增益:i=h-h(v),依次选取信息增益较大的特征作为所述识别分类器的分类节点,由此确定分类器的分类节点。
在一实施方式中,如图4所示,为一种基于行为特征的决策树分类器模型。在这里,第一个分类节点s401为最小值在0.5-1.5hz以及均值在0.5-1.5hz的范围,根据s401的节点可以区分出s402节点和s403节点,其中s402节点代表静止行为,s403节点为最大值在2-3hz以及协方差系数在1.5-2.5hz的范围。根据s402节点可以区分出s404节点和s405节点,其中s404节点为范围在2-3hz以及均方根为1.5-2.5hz的范围,s405节点为协方差系数在3-4hz的范围。由s404节点可以区分出s406节点和s407节点,其中s406节点代表上楼行为,s407节点代表步行行为。由s405节点可以区分出s408节点和s409节点,其中s408节点代表下楼行为,s409代表跑步行为。
本发明实施例另一方面,如图5所示,还提供了一种行为识别装置,所述装置包括:特征提取模块51、特征优选模块52和模型建立模块53,其中,所述特征提取模块51,用于获取设置的多个频段内的样本行为数据,根据各所述频段内的所述样本行为数据对应的频率特征分别确定对应的第一特征向量,形成第一特征向量集合;所述特征优选模块52,用于基于所述第一特征向量集合分别对所述第一特征向量进行筛选,选取所述第一特征向量的部分频率特征作为初始的目标子集,根据所述目标子集的编码对应的适应度值、以及另一部分频率特征对应的其它子集的编码进行交叉编码后的适应度值对所述目标子集进行更新,根据更新后的所述目标子集确定对所述第一特征向量筛选后的第二特征向量,形成第二特征向量集合;所述模型建立模块53,用于确定所述第二特征向量集合中各所述第二特征向量与样本行为类别的映射关系,根据所述映射关系建立行为识别模型。
在本申请上述实施方式中,通过获取设置的多个频段内的样本行为数据,根据各所述频段内的所述样本行为数据对应的频率特征分别确定对应的第一特征向量,形成第一特征向量集合;如此,对频段范围内的样本行为进行分解,获得适用于区分样本行为的特征信息。再通过基于所述第一特征向量集合分别对所述第一特征向量进行筛选,选取所述第一特征向量的部分频率特征作为初始的目标子集,根据所述目标子集的编码对应的适应度值、以及另一部分频率特征对应的其它子集的编码进行交叉编码后的适应度值对所述目标子集进行更新,根据更新后的所述目标子集确定对所述第一特征向量筛选后的第二特征向量,形成第二特征向量集合;如此,对特征信息进行降维,减小了运算的复杂度,并且保证了行为识别的准确率。最后通过确定所述第二特征向量集合中各所述第二特征向量与样本行为类别的映射关系,根据所述映射关系建立行为识别模型。由此实现了一种新的行为识别方法,可以有效地提高行为识别的准确率并且降低模型训练的复杂程度。
可选地,特征提取模块51,还用于在所述获取设置的多个频段内的样本行为数据之前,获取用于表征样本行为的三轴加速度数据,对所述加速度数据进行频域分析,根据频域分析后的所述加速度数据的频率分布确定分别与不同样本行为类别对应的频段。
可选地,特征提取模块51,还用于在所述根据各所述频段内的所述样本行为数据对应的频率特征分别确定对应的第一特征向量时,根据各所述频段内的所述样本行为数据确定对应的如下至少其中之一频率特征:最大值、最小值、中间值、均值、范围、方差、主系数和、均方根、协方差系数、信号幅度区域、信号向量幅度和直流分量;还包括分别确定与所述各频段对应的第一特征向量。
可选地,如图6所示,特征优选模块52还包括选择模块601和确定模块602,其中选择模块601用于将所述第一特征向量中频率特征进行编码,选择m个频率特征作为初始的目标子集,其中m≥1;将剩余子集进行交叉编码,得到新的特征集合,根据所述目标子集和所述新的特征集合分别对应的自适应度值对所述目标子集进行更新;确定模块602用于确定所述目标子集符合设定条件时,则根据更新后的所述目标子集确定所述第一特征向量筛选后的第二特征向量。
可选地,选择模块601还包括根据所述初始的目标子集中各子集的适应度值,确定适应度值符合设置范围的一个或多个子集为目标子集。
可选地,确定模块602用于确定进行交叉编码的次数满足预设条件时,则确定所述目标子集符合设定条件;
或者,确定交叉编码后符合收敛条件时,则确定所述目标子集符合设定条件。
可选地,模型建立模块53还用于根据所述第二特征向量集合中各所述第二特征向量包含的频率特征,确定分别与各所述频段对应的分类节点;基于所述分类节点与各所述频段对应的样本行为类别,建立所述第二特征向量集合中各所述第二特征向量与样本行为类别的映射关系。
可选地,模型建立模块53还用于构建树形结构的识别分类器,所述识别分类器的分类节点由所述第二特征向量集合中各所述第二特征向量包含的频率特征组成;确定所述分类节点的信息熵和条件熵,得到分叉时的信息增益,根据所述信息增益的大小确定所述分类节点以及所述分类节点在所述识别分类器中的位置。
在另一实施方式中,如图7所示,还提供了一种行为识别装置,包括:至少一个处理器71和用于存储能够在处理器71上运行的计算机程序的存储器72;其中,图7中示意的处理器71并非用于指代处理器的个数为一个,而是仅用于指代处理器相对其他器件的位置关系,在实际应用中,处理器的个数可以为一个或多个;同样,图7中示意的存储器72也是同样的含义,即仅用于指代存储器相对其他器件的位置关系,在实际应用中,存储器的个数可以为一个或多个。
其中,所述处理器71用于运行所述计算机程序时,执行如下步骤:
获取设置的多个频段内的样本行为数据,根据各所述频段内的所述样本行为数据对应的频率特征分别确定对应的第一特征向量,形成第一特征向量集合;
基于所述第一特征向量集合分别对所述第一特征向量进行筛选,选取所述第一特征向量的部分频率特征作为初始的目标子集,根据所述目标子集的编码对应的适应度值、以及另一部分频率特征对应的其它子集的编码进行交叉编码后的适应度值对所述目标子集进行更新,根据更新后的所述目标子集确定对所述第一特征向量筛选后的第二特征向量,形成第二特征向量集合;
确定所述第二特征向量集合中各所述第二特征向量与样本行为类别的映射关系,根据所述映射关系建立行为识别模型。
在一个可选的实施例中,所述处理器71还用于运行所述计算机程序时,执行如下步骤:
所述获取设置的多个频段内的样本行为数据之前,包括:
获取用于表征样本行为的三轴加速度数据,对所述加速度数据进行频域分析,根据频域分析后的所述加速度数据的频率分布确定分别与不同样本行为类别对应的频段。
在一个可选的实施例中,所述处理器71还用于运行所述计算机程序时,执行如下步骤:
所述根据各所述频段内的所述样本行为数据对应的频率特征分别确定对应的第一特征向量,包括:
根据各所述频段内的所述样本行为数据对应的如下至少其中之一频率特征:最大值、最小值、中间值、均值、范围、方差、主系数和、均方根、协方差系数、信号幅度区域、信号向量幅度和直流分量;
分别确定与所述各频段对应的第一特征向量。
在一个可选的实施例中,所述处理器71还用于运行所述计算机程序时,执行如下步骤:
所述选取所述第一特征向量的部分频率特征作为初始的目标子集,根据所述目标子集的编码对应的适应度值、以及另一部分频率特征对应的其它子集的编码进行交叉编码后的适应度值对所述目标子集进行更新,根据更新后的所述目标子集确定对所述第一特征向量筛选后的第二特征向量,包括:
将所述第一特征向量中频率特征进行编码,选择m个频率特征作为初始的目标子集,其中m≥1;将剩余子集进行交叉编码,得到新的特征集合,根据所述目标子集和所述新的特征集合分别对应的适应度值对所述目标子集进行更新;
确定所述目标子集符合设定条件时,则根据更新后的所述目标子集确定所述第一特征向量筛选后的第二特征向量。
在一个可选的实施例中,所述处理器71还用于运行所述计算机程序时,执行如下步骤:
所述将剩余子集进行交叉编码之前,包括:
根据所述初始的目标子集中各子集的适应度值,确定适应度值符合设置范围的一个或多个子集为目标子集。
在一个可选的实施例中,所述处理器71还用于运行所述计算机程序时,执行如下步骤:
所述确定所述目标子集符合设定条件,包括如下至少之一:
确定进行交叉编码的次数满足预设条件时,则确定所述目标子集符合设定条件;
确定交叉编码后符合收敛条件时,则确定所述目标子集符合设定条件。
在一个可选的实施例中,所述处理器71还用于运行所述计算机程序时,执行如下步骤:
确定所述目标子集不符合所述设定条件时,根据所述新的特征集合重新选择目标子集,并返回所述根据所述初始群体中剩余子集进行交叉编码的步骤。
在一个可选的实施例中,所述处理器71还用于运行所述计算机程序时,执行如下步骤:
所述确定所述第二特征向量集合中各所述第二特征向量与样本行为类别的映射关系,包括:
根据所述第二特征向量集合中各所述第二特征向量包含的频率特征,确定分别与各所述频段对应的分类节点;
基于所述分类节点与各所述频段对应的样本行为类别,建立所述第二特征向量集合中各所述第二特征向量与样本行为类别的映射关系。
在一个可选的实施例中,所述处理器71还用于运行所述计算机程序时,执行如下步骤:
所述确定分别与各所述频段对应的分类节点,包括:
构建树形结构的识别分类器,所述识别分类器的分类节点由所述第二特征向量集合中各所述第二特征向量包含的频率特征组成;
确定所述分类节点的信息熵和条件熵,得到分叉时的信息增益,根据所述信息增益的大小确定所述分类节点以及所述分类节点在所述识别分类器中的位置。
该装置还可以包括:至少一个网络接口73。发送端中的各个组件通过总线系统74耦合在一起。可理解,总线系统74用于实现这些组件之间的连接通信。总线系统74除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图7中将各种总线都标为总线系统74。
其中,存储器72可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(rom,readonlymemory)、可编程只读存储器(prom,programmableread-onlymemory)、可擦除可编程只读存储器(eprom,erasableprogrammableread-onlymemory)、电可擦除可编程只读存储器(eeprom,electricallyerasableprogrammableread-onlymemory)、磁性随机存取存储器(fram,ferromagneticrandomaccessmemory)、快闪存储器(flashmemory)、磁表面存储器、光盘、或只读光盘(cd-rom,compactdiscread-onlymemory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(ram,randomaccessmemory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(sram,staticrandomaccessmemory)、同步静态随机存取存储器(ssram,synchronousstaticrandomaccessmemory)、动态随机存取存储器(dram,dynamicrandomaccessmemory)、同步动态随机存取存储器(sdram,synchronousdynamicrandomaccessmemory)、双倍数据速率同步动态随机存取存储器(ddrsdram,doubledataratesynchronousdynamicrandomaccessmemory)、增强型同步动态随机存取存储器(esdram,enhancedsynchronousdynamicrandomaccessmemory)、同步连接动态随机存取存储器(sldram,synclinkdynamicrandomaccessmemory)、直接内存总线随机存取存储器(drram,directrambusrandomaccessmemory)。本发明实施例描述的存储器72旨在包括但不限于这些和任意其它适合类型的存储器。
本发明实施例中的存储器72用于存储各种类型的数据以支持发送端的操作。这些数据的示例包括:用于在发送端上操作的任何计算机程序,如操作系统和应用程序。其中,操作系统包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序可以包含各种应用程序,用于实现各种应用业务。这里,实现本发明实施例方法的程序可以包含在应用程序中。
本实施例还提供了一种计算机存储介质,例如包括存储有计算机程序的存储器72,上述计算机程序可由发送端中的处理器71执行,以完成前述方法所述步骤。计算机存储介质可以是fram、rom、prom、eprom、eeprom、flashmemory、磁表面存储器、光盘、或cd-rom等存储器;也可以是包括上述存储器之一或任意组合的各种设备,如智能手机、平板电脑、笔记本电脑等。一种计算机存储介质,所述计算机存储介质中存储有计算机程序,所述计算机程被处理器运行时,执行如下步骤:
其中,所述处理器71用于运行所述计算机程序时,执行如下步骤:
获取设置的多个频段内的样本行为数据,根据各所述频段内的所述样本行为数据对应的频率特征分别确定对应的第一特征向量,形成第一特征向量集合;
基于所述第一特征向量集合分别对所述第一特征向量进行筛选,选取所述第一特征向量的部分频率特征作为初始的目标子集,根据所述目标子集的编码对应的适应度值、以及另一部分频率特征对应的其它子集的编码进行交叉编码后的适应度值对所述目标子集进行更新,根据更新后的所述目标子集确定对所述第一特征向量筛选后的第二特征向量,形成第二特征向量集合;
确定所述第二特征向量集合中各所述第二特征向量与样本行为类别的映射关系,根据所述映射关系建立行为识别模型。
在一个可选的实施例中,所述计算机程序被处理器运行时,还执行如下步骤:
所述获取设置的多个频段内的样本行为数据之前,包括:
获取用于表征样本行为的三轴加速度数据,对所述加速度数据进行频域分析,根据频域分析后的所述加速度数据的频率分布确定分别与不同样本行为类别对应的频段。
在一个可选的实施例中,所述计算机程序被处理器运行时,还执行如下步骤:
所述根据各所述频段内的所述样本行为数据对应的频率特征分别确定对应的第一特征向量,包括:
根据各所述频段内的所述样本行为数据对应的如下至少其中之一频率特征:最大值、最小值、中间值、均值、范围、方差、主系数和、均方根、协方差系数、信号幅度区域、信号向量幅度和直流分量;
分别确定与所述各频段对应的第一特征向量。
在一个可选的实施例中,所述计算机程序被处理器运行时,还执行如下步骤:
所述选取所述第一特征向量的部分频率特征作为初始的目标子集,根据所述目标子集的编码对应的适应度值、以及另一部分频率特征对应的其它子集的编码进行交叉编码后的适应度值对所述目标子集进行更新,根据更新后的所述目标子集确定对所述第一特征向量筛选后的第二特征向量,包括:
将所述第一特征向量中频率特征进行编码,选择m个频率特征作为初始的目标子集,其中m≥1;将剩余子集进行交叉编码,得到新的特征集合,根据所述目标子集和所述新的特征集合分别对应的适应度值对所述目标子集进行更新;
确定所述目标子集符合设定条件时,则根据更新后的所述目标子集确定所述第一特征向量筛选后的第二特征向量。
在一个可选的实施例中,所述计算机程序被处理器运行时,还执行如下步骤:
所述将剩余子集进行交叉编码之前,包括:
根据所述初始的目标子集中各子集的适应度值,确定适应度值符合设置范围的一个或多个子集为目标子集。
在一个可选的实施例中,所述计算机程序被处理器运行时,还执行如下步骤:
所述确定所述目标子集符合设定条件,包括如下至少之一:
确定进行交叉编码的次数满足预设条件时,则确定所述目标子集符合设定条件;
确定交叉编码后符合收敛条件时,则确定所述目标子集符合设定条件。
在一个可选的实施例中,所述计算机程序被处理器运行时,还执行如下步骤:
确定所述目标子集不符合所述设定条件时,根据所述新的特征集合重新选择目标子集,并返回所述根据所述初始群体中剩余子集进行交叉编码的步骤。
在一个可选的实施例中,所述计算机程序被处理器运行时,还执行如下步骤:
所述确定所述第二特征向量集合中各所述第二特征向量与样本行为类别的映射关系,包括:
根据所述第二特征向量集合中各所述第二特征向量包含的频率特征,确定分别与各所述频段对应的分类节点;
基于所述分类节点与各所述频段对应的样本行为类别,建立所述第二特征向量集合中各所述第二特征向量与样本行为类别的映射关系。
在一个可选的实施例中,所述计算机程序被处理器运行时,还执行如下步骤:
所述确定分别与各所述频段对应的分类节点,包括:
构建树形结构的识别分类器,所述识别分类器的分类节点由所述第二特征向量集合中各所述第二特征向量包含的频率特征组成;
确定所述分类节点的信息熵和条件熵,得到分叉时的信息增益,根据所述信息增益的大小确定所述分类节点以及所述分类节点在所述识别分类器中的位置。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
1.一种行为识别方法,其特征在于,所述方法包括:
获取设置的多个频段内的样本行为数据,根据各所述频段内的所述样本行为数据对应的频率特征分别确定对应的第一特征向量,形成第一特征向量集合;
基于所述第一特征向量集合分别对所述第一特征向量进行筛选,选取所述第一特征向量的部分频率特征作为初始的目标子集,根据所述目标子集的编码对应的适应度值、以及另一部分频率特征对应的其它子集的编码进行交叉编码后的适应度值对所述目标子集进行更新,根据更新后的所述目标子集确定对所述第一特征向量筛选后的第二特征向量,形成第二特征向量集合;
确定所述第二特征向量集合中各所述第二特征向量与样本行为类别的映射关系,根据所述映射关系建立行为识别模型。
2.根据权利要求1所述的行为识别方法,其特征在于,所述获取设置的多个频段内的样本行为数据之前,包括:
获取用于表征样本行为的三轴加速度数据,对所述加速度数据进行频域分析,根据频域分析后的所述加速度数据的频率分布确定分别与不同样本行为类别对应的频段。
3.根据权利要求1所述的行为识别方法,其特征在于,所述根据各所述频段内的所述样本行为数据对应的频率特征分别确定对应的第一特征向量,包括:
根据各所述频段内的所述样本行为数据对应的如下至少其中之一频率特征:最大值、最小值、中间值、均值、范围、方差、主系数和、均方根、协方差系数、信号幅度区域、信号向量幅度和直流分量;
分别确定与所述各频段对应的第一特征向量。
4.根据权利要求1所述的行为识别方法,其特征在于,所述选取所述第一特征向量的部分频率特征作为初始的目标子集,根据所述目标子集的编码对应的适应度值、以及另一部分频率特征对应的其它子集的编码进行交叉编码后的适应度值对所述目标子集进行更新,根据更新后的所述目标子集确定对所述第一特征向量筛选后的第二特征向量,包括:
将所述第一特征向量中频率特征进行编码,选择m个频率特征作为初始的目标子集,其中m≥1;将剩余子集进行交叉编码,得到新的特征集合,根据所述目标子集和所述新的特征集合分别对应的适应度值对所述目标子集进行更新;
确定所述目标子集符合设定条件时,则根据更新后的所述目标子集确定所述第一特征向量筛选后的第二特征向量。
5.根据权利要求4所述的行为识别方法,其特征在于,所述将剩余子集进行交叉编码之前,包括:
根据所述初始的目标子集中各子集的适应度值,确定适应度值符合设置范围的一个或多个子集为目标子集。
6.根据权利要求4所述的行为识别方法,其特征在于,所述确定所述目标子集符合设定条件,包括如下至少之一:
确定进行交叉编码的次数满足预设条件时,则确定所述目标子集符合设定条件;
确定交叉编码后符合收敛条件时,则确定所述目标子集符合设定条件。
7.根据权利要求4所述的行为识别方法,其特征在于,还包括:
确定所述目标子集不符合所述设定条件时,根据所述新的特征集合重新选择目标子集,并返回所述根据所述初始群体中剩余子集进行交叉编码的步骤。
8.根据权利要求1所述的行为识别方法,其特征在于,所述确定所述第二特征向量集合中各所述第二特征向量与样本行为类别的映射关系,包括:
根据所述第二特征向量集合中各所述第二特征向量包含的频率特征,确定分别与各所述频段对应的分类节点;
基于所述分类节点与各所述频段对应的样本行为类别,建立所述第二特征向量集合中各所述第二特征向量与样本行为类别的映射关系。
9.根据权利要求8所述的行为识别方法,其特征在于,所述确定分别与各所述频段对应的分类节点,包括:
构建树形结构的识别分类器,所述识别分类器的分类节点由所述第二特征向量集合中各所述第二特征向量包含的频率特征组成;
确定所述分类节点的信息熵和条件熵,得到分叉时的信息增益,根据所述信息增益的大小确定所述分类节点以及所述分类节点在所述识别分类器中的位置。
10.一种行为识别装置,其特征在于,所述装置包括:特征提取模块、特征优选模块和模型建立模块,其中,
所述特征提取模块,用于获取设置的多个频段内的样本行为数据,根据各所述频段内的所述样本行为数据对应的频率特征分别确定对应的第一特征向量,形成第一特征向量集合;
所述特征优选模块,用于基于所述第一特征向量集合分别对所述第一特征向量进行筛选,选取所述第一特征向量的部分频率特征作为初始的目标子集,根据所述目标子集的编码对应的适应度值、以及另一部分频率特征对应的其它子集的编码进行交叉编码后的适应度值对所述目标子集进行更新,根据更新后的所述目标子集确定对所述第一特征向量筛选后的第二特征向量,形成第二特征向量集合;
所述模型建立模块,用于确定所述第二特征向量集合中各所述第二特征向量与样本行为类别的映射关系,根据所述映射关系建立行为识别模型。
11.一种行为识别装置,其特征在于,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器;
其中,所述处理器用于运行所述计算机程序时,实现权利要求1至9任一项所述的行为识别方法。
12.一种计算机存储介质,其特征在于,所述计算机存储介质中存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9中任一项所述行为识别方法。
技术总结