社交信息服务中用户属性推演方法及系统与流程

    专利2022-07-08  166


    本发明涉及信息安全技术领域,尤其是涉及一种社交信息服务中用户属性推演方法及系统。



    背景技术:

    随着在线社交网络的日益发展,社交网络在人和人之间的联系交往中变得愈发重要,网络信息也变得十分丰富。社交网络信息分析和挖掘已经成为了工业界和学术界的热门研究问题。社交网络中汇聚着大量的用户属性信息、人际关系信息和用户行为信息,比如用户提供的性别、电话、家庭住址等属性信息,在即时通讯应用中用户的好友以及群组关系,在各类网络服务中用户购买物品、给出评价、观看视频等行为信息。分析社交网络中用户的各类信息的关联性能够帮助挖掘出更深层次的用户属性,更准确的预测用户下一步的行为,为研究社交网络发展方向提供数据支撑。

    目前在社交网络属性推演的研究中,主要有以下三种方法:基于特征的方法、基于网络结构的方法以及结合二者的方法。每种方法有各自的优缺点,适用于不同的场景。基于用户特征的方法是指分析已标记的用户数据,找出具有区分意义的特征,利用机器学习算法等方法构建模型,推测未标记用户的属性数据;基于网络结构的方法利用用户的好友关系、社区分类进行建模,进一步推演用户的属性;将二者相结合的方法是指对用户的特征进行分析处理,通过用户关系建模,利用随机游走等算法进行属性推演的方法。

    然而,现有技术中的属性推演方法缺少应用于大规模社交网络数据集的算法性能测试,另外在大规模社交网络数据集中,已知的用户属性占少部分,从部分已知属性推演未知属性的精确度有待提高,推演算法的精度和扩展性差。因此,上述技术存在改进空间。



    技术实现要素:

    本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明的一个目的在于提出一种社交信息服务中用户属性推演方法,所述方法可以实现根据社交网络中部分已知属性信息,高效地推演出其他未知属性信息,提高了推演的准确性和扩展性。

    本发明还提出了一种具有上述社交信息服务中用户属性推演方法的系统。

    根据本发明实施例的社交信息服务中用户属性推演方法,包括以下步骤:

    s1,根据用户属性值挖掘多种属性之间的关联性并使用kulc系数度量关联性,得到多种属性之间关联性的值;

    s2,根据多种属性之间关联性和用户节点的第一特征向量,对用户的第一特征向量进行特征变换,得到用户节点的第二特征向量;

    s3,根据用户节点的第二特征向量以及svm分类方法,得到用户有该属性的先验概率;

    s4,利用马尔可夫随机场对用户社交关系信息进行建模,在马尔可夫随机场中对用户先验概率进行置信传播,获得用户有该属性的后验概率。

    根据本发明的社交信息服务中用户属性推演方法,所述方法可以实现根据社交网络中部分已知属性信息,高效地推演出其他未知属性信息,提高了推演的准确性和扩展性。

    根据本发明一个实施例的社交信息服务中用户属性推演方法,步骤s2包括以下步骤:

    s201,初始化已知标签的用户节点的属性行为向量,即

    s202,根据用户属性之间相关性计算权重值w(aij,ast);

    s203,根据属性和目标属性的权重值计算权重向量

    s204,利用属性值之间的权重和用户及属性之间的权重对属性行为特征向量进行加权,通过变换获得加权后的属性行为特征向量

    根据本发明一个实施例的社交信息服务中用户属性推演方法,两个属性之间的关联性可表示为δ2:{aij→ast},其中aij表示属性值,两个属性之间的kulc系数度量关联性表示为

    根据本发明一个实施例的社交信息服务中用户属性推演方法,三个属性之间的关联性可表示为,δ3:{(aij,akl)→ast},δ3-1:{ast→(aij,akl)},三个属性之间的kulc系数度量关联性表示为

    根据本发明一个实施例的社交信息服务中用户属性推演方法,对于三种属性关联性,当推演的目标属性为as时,表达式为

    根据本发明一个实施例的社交信息服务中用户属性推演方法,通过变换获得加权后的特征向量

    根据本发明一个实施例的社交信息服务中用户属性推演方法,采用基于数据立方体的apriori算法挖掘属性关联规则。

    根据本发明一个实施例的社交信息服务中用户属性推演方法,利用马尔可夫随机场对用户社交关系信息进行建模时,使用图传播算法在社交网络图中利用loopybeliefpropagation进行置信传播。

    根据本发明的第二方面的社交信息服务中用户属性推演系统,采用了如第一方面任一种所述的社交信息服务中用户属性推演方法。所述系统与上述的社交信息服务中用户属性推演方法相对于现有技术所具有的优势相同,在此不再赘述。

    本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

    附图说明

    本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:

    图1是根据本发明实施例的社交信息服务中用户属性推演方法的流程图;

    图2是根据本发明实施例的步骤s2的流程图;

    图3是根据本发明实施例的社交信息服务中用户属性推演方法的社交网络模型示意图。

    具体实施方式

    下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。

    在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

    下面参考图1-图3描述根据本发明实施例的社交信息服务中用户属性推演方法。如图1所示,根据本发明实施例的根据本发明实施例的社交信息服务中用户属性推演方法,包括以下步骤:

    s1,根据用户属性值挖掘多种属性之间的关联性并使用kulc系数度量关联性,得到多种属性之间关联性的值;

    s2,根据多种属性之间关联性和用户节点的第一特征向量,对用户的第一特征向量进行特征变换,得到用户节点的第二特征向量;

    s3,根据用户节点的第二特征向量以及svm分类方法,得到用户有该属性的先验概率;

    s4,利用马尔可夫随机场对用户社交关系信息进行建模,在马尔可夫随机场中对用户先验概率进行置信传播,获得用户有该属性的后验概率。

    根据本发明的社交信息服务中用户属性推演方法,可以实现根据社交网络中部分已知属性信息,高效地推演出其他未知属性信息,提高了推演的准确性和扩展性。

    进一步地,在具体详解本发明的社交信息服务中用户属性推演方法之前,首先,可以将社交网络抽象表示为一个图,g=(v,e,w),其中v表示社交网络中所有的节点的集合。进一步地,社交网络图模型中有三种节点,即用户节点,属性节点,行为节点,即v=vu∪va∪vb,其中vu表示社交网络中所有的用户节点的集合,va表示社交网络中所有的属性节点的集合,vb表示社交网络中所有的行为节点的集合。

    进一步地,对于所有属性节点的集合,va={a1,a2,a3,...,an},a表示社交网络中每个用户的属性,ai={ai1,ai2,...,ain},aij表示属性ai的第j个属性值。进一步地,vb={b1,b2,b3,...,bm}。进一步地,社交网络中的用户有n个属性,属性i有n个属性值,设每个属性的属性值个数为ni,属性值维数进一步地,社交网络中的用户有m个行为,e表示社交网络节点之间的关系边的集合,w表示社交网络节点之间关系边权重的集合。

    需要说明的是,本发明实施例的社交信息服务中用户属性推演方法的输入为社交网络构成的网络图g及部分已经带标签的用户属性特征向量,输出为除已知特征向量外社交网络中其他用户的属性特征向量。

    根据本发明一个实施例的社交信息服务中用户属性推演方法,采用基于数据立方体的apriori算法挖掘属性关联规则。

    进一步地,采用基于数据立方体的apriori算法挖掘属性关联规则包括如下两步,第一步是找出所有频繁项集;第二步是由频繁项集产生强关联规则,需要说明的是,这些规则必须满足最小支持度和最小置信度。

    具体地,基于数据立方体的apriori算法过程的输入为一个n维的数据立方体cb[d1,d2,d3,...,dn],最小支持度min_sup。具体步骤如下:

    首先进行初始化,即设置n维间的频繁项目集l;

    其次,对每一维生成1-itemset候选集,即ci,di={di维中所有互不相同的取值},

    然后,生成1-itemset频繁项目集l1=gen_frequent(1,c1);之后循环生成k-itemsets候选集,生成k-itemsets频繁集,l=l∪lk;直到lk为空时停止循环。这一过程输出为n维间的频繁项目集l。

    其中,gen_frequent(1,c1)是从候选集ck中生成频繁项目集lk,gen_candidate(k,lk-1)是从(k-1)频繁项目集中k-itemset候选集。根据本发明一个实施例的社交信息服务中用户属性推演方法,如图2所示,步骤s2包括以下步骤:

    s201,初始化已知标签的用户节点的属性行为向量,即

    s202,根据用户属性之间相关性计算权重值w(aij,ast);

    s203,根据属性和目标属性的权重值计算权重向量

    s204,利用属性值之间的权重和用户及属性之间的权重对属性行为特征向量进行加权,通过变换获得加权后的属性行为特征向量

    根据本发明一个实施例的社交信息服务中用户属性推演方法,两个属性之间的关联性可表示为δ2:{aij→ast},其中aij表示属性值,两个属性之间的kulc系数度量关联性表示为

    根据本发明一个实施例的社交信息服务中用户属性推演方法,三个属性之间的关联性可表示为,δ3:{(aij,akl)→ast},δ3-1:{ast→(aij,akl)},三个属性之间的kulc系数度量关联性表示为

    需要说明的是,

    根据本发明一个实施例的社交信息服务中用户属性推演方法,对于三种属性关联性,设目标属性as,有n个属性值,as={as1,as2,...,asn},其中属性值的编码为x,初始化已知标签的用户节点的属性行为向量

    当推演的目标属性为as时,表达式为

    根据本发明一个实施例的社交信息服务中用户属性推演方法,通过变换获得加权后的特征向量

    需要说明的是,对于其中每一维表示基于多维属性关联性的属性值aij对目标属性值ast的加权属性特征。

    设目标属性as,有n个属性值,as={as1,as2,...,asn},δ3:{(aij,akl)→ast},δ2:{aij→ast},用户u的属性行为向量为

    当目标属性为as,

    进一步地,权重向量的每一维是相关属性值和目标属性值之间的权重,其中,α是属性权重系数。

    进一步地,对于四维属性行为相关,当推演的目标属性为as时,

    对于其中每一维表示基于多维属性关联性的属性值aij对目标属性值ast的加权属性特征。

    对于用户的属性行为向量针对目标属性as进行扩展,即

    其中,

    权重向量为

    进一步地,在步骤s3中,每个用户的特征向量为svm输入的一条,具体地,步骤s3中输入每个用户的经机器学习中的svm方法,设置svm核函数为rbfkernel,利用cross-validation得到c和g,进一步训练数据获得用户具有该目标属性的先验概率qu。

    根据本发明一个实施例的社交信息服务中用户属性推演方法,利用马尔可夫随机场对用户社交关系信息进行建模时,使用图传播算法在社交网络图中利用loopybeliefpropagation进行置信传播。

    进一步地,在置信传播中,第t次迭代传递信息为:

    其中:qu是目标用户有目标属性的先验概率,

    w是边(u,v)的权重。

    进一步地,求得目标用户有目标属性ast的后验概率:

    综上所述,根据本发明的社交信息服务中用户属性推演方法,可以实现根据社交网络中部分已知属性信息,高效地推演出其他未知属性信息,提高了推演的准确性和扩展性。

    本发明还提供了一种社交信息服务中用户属性推演系统,该系统采用了上述的社交信息服务中用户属性推演方法,从而具有推演的准确性更高、扩展性更强等优点。

    在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

    尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。


    技术特征:

    1.一种社交信息服务中用户属性推演方法,其特征在于,包括以下步骤:

    s1,根据用户属性值挖掘多种属性之间的关联性并使用kulc系数度量关联性,得到多种属性之间关联性的值;

    s2,根据多种属性之间关联性和用户节点的第一特征向量,对用户的第一特征向量进行特征变换,得到用户节点的第二特征向量;

    s3,根据用户节点的第二特征向量以及svm分类方法,得到用户有该属性的先验概率;

    s4,利用马尔可夫随机场对用户社交关系信息进行建模,在马尔可夫随机场中对用户先验概率进行置信传播,获得用户有该属性的后验概率。

    2.根据权利要求1所述的社交信息服务中用户属性推演方法,其特征在于,步骤s2包括以下步骤:

    s201,初始化已知标签的用户节点的属性行为向量,即

    s202,根据用户属性之间相关性计算权重值w(aij,ast);

    s203,根据属性和目标属性的权重值计算权重向量

    s204,利用属性值之间的权重和用户及属性之间的权重对属性行为特征向量进行加权,通过变换获得加权后的属性行为特征向量

    3.根据权利要求1所述的社交信息服务中用户属性推演方法,其特征在于,两个属性之间的关联性可表示为δ2:{aij→ast},其中aij表示属性值,两个属性之间的kulc系数度量关联性表示为

    4.根据权利要求1所述的社交信息服务中用户属性推演方法,其特征在于,三个属性之间的关联性可表示为,δ3:{(aij,akl)→ast},δ3-1:{ast→(aij,akl)},三个属性之间的kulc系数度量关联性表示为

    5.根据权利要求4所述的社交信息服务中用户属性推演方法,其特征在于,对于三种属性关联性,当推演的目标属性为as时,表达式为

    6.根据权利要求2所述的社交信息服务中用户属性推演方法,其特征在于,通过变换获得加权后的特征向量

    7.根据权利要求2-6中任一项所述的社交信息服务中用户属性推演方法,其特征在于,采用基于数据立方体的apriori算法挖掘属性关联规则。

    8.根据权利要求7所述的社交信息服务中用户属性推演方法,其特征在于,利用马尔可夫随机场对用户社交关系信息进行建模时,使用图传播算法在社交网络图中利用loopybeliefpropagation进行置信传播。

    9.一种社交信息服务中用户属性推演系统,其特征在于,采用了根据权利要求1-8中任一项所述的社交信息服务中用户属性推演方法。

    技术总结
    本发明公开了一种社交信息服务中用户属性推演方法及系统,所述方法包括以下步骤:S1,根据用户属性值挖掘多种属性之间的关联性并使用Kulc系数度量关联性,得到多种属性之间关联性的值;S2,根据多种属性之间关联性和用户节点的第一特征向量,对用户的第一特征向量进行特征变换,得到用户节点的第二特征向量;S3,根据用户节点的第二特征向量以及SVM分类方法,得到用户有该属性的先验概率;S4,利用马尔可夫随机场对用户社交关系信息进行建模,在马尔可夫随机场中对用户先验概率进行置信传播,获得用户有该属性的后验概率。根据本发明的方法可以实现根据社交网络中部分已知属性信息,高效地推演出其他未知属性信息,提高了推演的准确性和扩展性。

    技术研发人员:毛剑;杨依桐;林其萧;刘建伟
    受保护的技术使用者:北京航空航天大学
    技术研发日:2020.12.18
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-16944.html

    最新回复(0)