一种针对协同过滤中共谋推断攻击的差分隐私保护方法与流程

    专利2022-07-08  115


    本发明涉及一种差分隐私保护方法,尤其涉及一种针对协同过滤中共谋推断攻击的差分隐私保护方法。



    背景技术:

    近年来,随着互联网的快速发展,网络信息资源呈指数级增长,使得用户难以有效地从海量资源中获取有用的数据。协同过滤利用与用户兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的内容,已成为目前最常用的推荐技术。然而,协同过滤在帮助用户从海量信息资源中发现潜在感兴趣的内容的同时,也为用户带来了隐私泄露风险。由于每个用户的推荐结果都是来自与之具有相似偏好的用户,一个恶意用户在知道目标用户部分偏好信息的前提下,就可以创建一些与目标用户相似的虚假账号,并分析这些虚假账号的推荐结果,通过共谋攻击的方式推断目标用户的其它偏好信息。相较于传统的推断攻击,共谋攻击能够显著提升攻击者推断用户隐私信息的概率。

    差分隐私是一个严格的隐私定义,该定义保证了任意一条数据的出现与否对于查询结果几乎没有影响。在差分隐私的定义下,即使一个攻击者知道除要保护数据之外的所有数据,差分隐私保护机制也能保证攻击者不能通过查询结果推测该数据的真实值。由于差分隐私具有与攻击者背景知识无关、能够对隐私保护提供严格的理论依据等特点,其一经提出,就被广泛地应用于各种隐私保护场景。mcsherry等人首次将差分隐私用于推荐场景中,实现保护用户隐私的目的。其核心思想如下:用户将自己的偏好数据发送至服务器端,服务器在收集了多个用户的偏好数据之后,根据netflixprize推荐算法的计算过程,分别计算内容的平均评分、用户的平均评分、以及内容之间的协方差,从而得到内容之间的相似度,并通过内容相似度为用户产生推荐结果。该方法在相似度计算过程中,对评分计算结果及协方差计算结果添加差分隐私噪声,使得一个用户数据存在与否对于计算结果几乎没有影响,从而保证攻击者无法根据推荐结果推测其他用户的偏好信息。zhou等人将差分隐私保护技术与分布式在线学习技术相结合,用于对云视频服务中的用户多媒体信息进行保护,从而保证用户的隐私。

    上述方法均假设攻击者仅使用一个恶意账号推测其他用户的隐私,攻击者依然可以通过多个用户共谋攻击的方式,提升推断用户隐私信息的能力。针对该问题,machanavajjhala等人将用户与用户之间的关系、以及用户与内容之间的关系构建成无向图,并通过保证图中邻居节点之间的边对于其它所有节点都是隐私的方式,防止共谋推断攻击。该方法认为如果一个机制能够保证任意一条用户关系存在与否,对于其他所有用户的推荐结果都几乎没有影响,那么该机制是隐私的。基于此思想,该方法在推荐功能评分计算过程中,通过拉普拉斯机制及指数机制对功能评分进行干扰,从而保证攻击者无法根据推荐结果推断其他用户的关系数据。然而,其研究结果表明,在对共谋攻击进行保护时,一条关系数据存在与否,会对多个节点被推荐给一个目标节点的功能性产生影响。这将导致敏感度过大的问题,将会添加大量差分隐私噪声,进而导致推荐结果准确性差的问题。为了解决该问题,yan等人提出了一个差分隐私保护的推荐框架dynaego,该框架包括数据分组、修改及推荐三个阶段。其中分组阶段又包括两个步骤:首先,对于任意一个用户,dynaego通过指数机制选择一批用户来参与分组过程,使得选择结果满足差分隐私定义,从而避免knn推断攻击;其次,对选择的用户按相似度分组,并通过同组用户的偏好数据为其进行推荐,从而降低计算复杂度。在修改阶段,dynaego通过指数机制对用户相似度及内容相似度进行干扰,并将干扰后的相似度评分用于推荐。在推荐阶段,dynaego对推荐算法不做任何改变,从而能够应用于现有的推荐系统。

    因此,对由共谋推断攻击导致的用户隐私泄露问题进行防御时,现有工作在用户之间相互独立的前提下进行保护,要么添加更多的噪声数据,要么对用户进行随机化分组,都将严重影响推荐准确性。



    技术实现要素:

    发明目的:本发明的目的为提供一种在保证用户隐私的前提下提升推荐准确性的针对协同过滤中共谋推断攻击的差分隐私保护方法。

    技术方案:本发明的针对协同过滤中共谋推断攻击的差分隐私保护方法,包括如下步骤:

    (1)根据用户相似性对用户进行分组,并根据分组结果为用户进行推荐,将强相似用户关联为整体用户,并为整体用户返回相同的推荐结果;

    (2)在添加差分隐私噪声前进行敏感度计算,分析任意一个用户数据存在与否对于其他任意数据推荐结果的最大影响;

    (3)对推荐功能性添加差分隐私噪声,并根据干扰的功能性为用户进行推荐。

    步骤(1)中,为整体用户返回相同的推荐结果,防止其进行共谋推断攻击。

    步骤(3)中,根据干扰的功能性为用户进行推荐,防止攻击者根据推荐结果推断其他用户的隐私信息。

    进一步地,步骤(1)具体包括如下步骤:

    (a)对于任意用户ui(i=1,2,...n),提取所有与ui相似性大于阈值参数d的用户,将所有与ui相似性大于阈值参数d的用户加入ui的分组

    (b)对于相似参数s,提取所有与ui相似性大于阈值参数s的用户,将所有与ui相似性大于阈值参数s的用户与ui关联为整体用户;

    (c)重复步骤(a)和(b),直到对所有用户进行分组、以及对强相似用户关联。

    步骤(b)中,s>>d。

    步骤(2)具体包括如下步骤:

    (a)将敏感度初始化为0;

    (b)对于任意用户ui(i=1,2,...n),将ui数据从全局用户历史数据矩阵m中删除,得到临近历史数据矩阵m′;

    (c)对于任意用户uj(j=1,2,...n,j≠i),分别计算m和m′中所有内容被推荐给uj的功能性,记为

    (d)在推荐k个内容的前提下,计算m和m′中最大的k个推荐功能性之差的总和;

    (e)如果推荐功能性之差大于敏感度,则将敏感度替换为推荐功能性之差;

    (f)重复步骤(a)~(e),直到寻找到任意一个用户存在与否对于推荐功能性最大的影响。

    步骤(3)具体包括如下步骤:

    (a)随机生成一个-0.5到0.5之间的自然数;

    (b)对于任意用户ui(i=1,2,...n),提取所有内容被推荐给ui的功能性;

    (c)对于任意内容cl(l=1,2,...,m),对将cl推荐给ui的功能性进行干扰,得到干扰功能性具体干扰方法为:

    式中,δf1为敏感度,ε为隐私预算,tmp为步骤(a)所生成的随机数;

    (d)重复步骤(a)~(c),直到将所有内容被推荐给ui的功能性进行干扰;

    (e)为ui推荐干扰后的推荐功能性最大的k个内容。

    本发明针对协同过滤中共谋推断攻击的差分隐私保护方法包括:

    (1)用户历史数据汇聚:协同过滤服务器收集用户的历史数据,构建用户对于内容的历史评分矩阵,为协同过滤推荐计算提供数据支持;

    (2)用户相似性计算:根据用户对于内容的历史评分,通过余弦相似度计算用户之间的相似性;

    (3)用户分组:首先,根据用户相似性,对用户进行分组,得到为用户进行推荐的数据来源;然后,根据用户相似性识别潜在可能进行共谋攻击的用户,并将其关联为整体用户。

    (4)推荐计算:对于需要接收推荐的用户,首先提取与该用户同组的用户,然后根据用户相似性以及用户对于内容的历史评分,预测每个内容被推荐给目标用户的功能评分。

    (5)噪声添加:首先,计算当任意用户数据存在或者不存在于数据集时,对于其他用户的推荐结果的最大影响,得到推荐函数的敏感度;然后,通过拉普拉斯机制对推荐功能评分添加满足差分隐私的噪声;最后,为用户推荐干扰后功能评分最大的topk个内容。

    进一步的,在步骤(1)中,本发明假设有n个用户(u={u1,u2,...,un})及m个内容(c={c1,c2,...,cm}),协同过滤推荐服务器收集用户对于内容的评分数据,并构造评分矩阵m。

    进一步的,步骤(2)中计算用户相似性的方法为:

    其中指用户ui对于内容cl的评分。

    进一步的,步骤(3)中基于用户相似性的用户分组方法具体包括:

    (a)对于任意目标用户ui以及给定的相似度距离参数d,本发明根据以下公式计算所有与该用户相似性大于d的用户:

    (b)构建所有用户的分组,其计算方法如下:

    进一步的,步骤(3)中的强相似用户关联方法如下:

    (c)对于任意给定的用户ui以及用户相似参数s(s>>d),通过分组方法,将所有与ui相似性大于s的用户关联为一个整体用户。

    进一步的,步骤(4)的推荐计算方法如下:

    (a)对于任意用户ui,本发明通过该用户的相似用户的历史数据,计算所有内容被推荐给ui的功能评分,其计算方法如下:

    进一步的,步骤(5)的噪声添加方法具体如下:

    (b)本发明假设一个推荐算法将内容cl推荐给用户ui的功能性为当为用户产生t个推荐内容时,本发明将敏感度定义为任意一个用户数据是否存在于m对其他任意一个目标用户的推荐功能性最大的影响,其计算方法如下:

    其中m与m′指仅相差一个用户数据的临近用户-内容评分矩阵。

    (c)对于任意给定的用户ui,对所有内容被推荐给ui的预测功能评分添加差分隐私噪声,具体干扰方法为:

    (d)为ui返回干扰后的推荐功能评分最大的t个内容。

    本发明的针对协同过滤中共谋推断攻击的差分隐私保护系统,包括用户分组模块、敏感度分析模块和用户推荐模块,用户分组模块用于根据用户相似性对用户进行分组,并根据分组结果为用户进行推荐,将强相似用户关联为整体用户,并为整体用户返回相同的推荐结果;敏感度分析模块用于在添加差分隐私噪声前进行敏感度计算,分析任意一个用户数据存在与否对于其他任意数据推荐结果的最大影响;用户推荐模块用于对推荐功能性添加差分隐私噪声,并根据干扰的功能性为用户进行推荐。

    有益效果:与现有技术相比,本发明具有如下显著优点:

    (1)能够提供严格的差分隐私保护,即使攻击者通过多个用户对目标用户进行共谋攻击,依然难以推断用户的隐私信息;

    (2)将强相似用户关联为整体用户,并为整体用户返回相同干扰推荐结果,在保证攻击者无法从共谋攻击中获取比普通推断攻击更多的隐私信息的基础上,显著降低差分隐私噪声大小;

    (3)对推荐结果进行干扰,不改变推荐算法的计算过程,使得隐私保护方法能够很好地部署于现有的推荐系统。

    附图说明

    图1是本发明针对共谋攻击的差分隐私保护方法流程图。

    具体实施方式

    下面结合实施例对本发明的技术方案作进一步说明。

    如图1所示,本实施方案提供一种针对协同过滤中共谋推断攻击的差分隐私保护方法。根据协同过滤推荐流程以及隐私保护策略,该方法包括五个步骤,分别是用户历史数据汇聚、用户相似性计算、用户分组、推荐计算以及噪声添加。

    1、用户历史数据汇聚

    用户ui(i=1,2,...,n)将自己的历史数据发送至协同过滤服务器,用于推荐服务。服务器收集所有的用户历史数据,构建用户对于内容的评分矩阵m。

    2、用户相似性计算

    对于任意两个用户ui与uj,协同过滤服务器根据余弦相似度计算方法计算ui与uj的历史数据之间的相似性,从而得到用户之间的相似性。

    3、用户分组

    对于任意用户ui,本发明首先根据用户相似性提取与ui相似的用户,并根据这些用户的历史数据为ui进行协同过滤推荐。在此基础上,本发明进一步将强相似用户关联为整体用户,攻击者通过这些用户进行共谋推断攻击。

    3.1相似用户提取

    首先设定用户相似参数d,然后对于任意用户ui,将所有与ui相似性大于d的用户提取到一个组,用于协同过滤推荐,具体流程如下:

    (1)输入用户列表ui(i=1,2,...,n),用户相似矩阵s,相似性阈值参数d;

    (2)初始化用户相似性分组

    (3)对于任意用户ui,提取其他所有用户uj(j=1,2,...,n,j≠i)与ui的相似性,如果相似性sim(ui,uj)大于阈值参数d,将uj加入ui的相似用户分组列表

    (4)重复上述步骤,将ui的相似用户分组列表加入全局用户相似性分组

    (5)返回用户相似性分组结果。

    3.2强相似用户关联

    为了对目标用户进行共谋推断攻击,攻击者需要保证参与共谋攻击的用户之间具有较强的相似性,使得他们的推荐结果之间具有较强的关联性,从而提升推断目标用户隐私信息的目的。针对该问题,本发明设置用户强相似参数s(s>>d),并通过上述相似用户分组方法将相似性大于s的用户关联为整体用户。

    4、推荐计算

    对于任意用户ui,本发明根据相似用户分组计算任意内容cl(l=1,2,...,m)被推荐给ui的功能性,计算方法如下:

    其中指用户uj对于内容cl的评分。

    5、噪声添加

    对于任意用户ui,本发明计算该用户数据是否存在于协同过滤数据中,对于其他用户推荐功能性最大的影响,从而计算推荐函数的敏感度。在此基础上,以敏感度为隐私保护目标,添加差分隐私噪声。

    5.1敏感度计算

    敏感度计算流程如下:

    (1)初始化敏感度δf1=0;

    (2)对于任意用户ui(i=1,2,...,n),从用户对于内容的评分矩阵m中删除ui的数据,得到临近历史评分矩阵m′;

    (3)对于任意用户uj(j=1,2,...,n,j≠i),计算在m中将任意内容cl(l=1,2,...,m)推荐给uj的功能性并计算在m′中将cl推荐给uj的功能性

    (4)分别提取m与m′中最大的k个推荐功能性,并计算功能性之差的绝对值之和;

    (5)如果上述计算结果大于敏感度,将敏感度替换为该差值;

    (6)重复上述步骤,计算出当任意用户存在与否时,对于其他任意用户推荐功能性最大的影响,并将其设置为敏感度;

    (7)返回敏感度。

    5.2推荐结果干扰

    在推荐结果干扰方面,本发明针对推荐功能性添加满足差分隐私的拉普拉斯噪声,并根据干扰后的推荐功能性为用户产生推荐结果,其计算方法如下:

    (1)输入需要推荐的用户ui,隐私预算ε,所有内容被推荐给ui的功能性敏感度δf1,推荐个数k;

    (2)对于任意内容cl(l=1,2,...,n),均生成一个-0.5到0.5之间的随机数;

    (3)对内容cl被推荐给ui的功能性添加差分隐私噪声,得到干扰推荐功能性其计算方法如下:

    (4)重复上述步骤,直到将所有内容被推荐给ui的功能性进行干扰;

    (5)为用户ui推荐干扰后推荐功能性最大的k个内容。

    本发明的针对协同过滤中共谋推断攻击的差分隐私保护系统,包括用户分组模块、敏感度分析模块和用户推荐模块,用户分组模块用于根据用户相似性对用户进行分组,并根据分组结果为用户进行推荐,将强相似用户关联为整体用户,并为整体用户返回相同的推荐结果;敏感度分析模块用于在添加差分隐私噪声前进行敏感度计算,分析任意一个用户数据存在与否对于其他任意数据推荐结果的最大影响;用户推荐模块用于对推荐功能性添加差分隐私噪声,并根据干扰的功能性为用户进行推荐。


    技术特征:

    1.一种针对协同过滤中共谋推断攻击的差分隐私保护方法,其特征在于,包括如下步骤:

    (1)根据用户相似性对用户进行分组,并根据分组结果为用户进行推荐,将强相似用户关联为整体用户,并为整体用户返回相同的推荐结果;

    (2)在添加差分隐私噪声前进行敏感度计算,分析任意一个用户数据存在与否对于其他任意数据推荐结果的最大影响;

    (3)对推荐功能性添加差分隐私噪声,并根据干扰的功能性为用户进行推荐。

    2.根据权利要求1所述针对协同过滤中共谋推断攻击的差分隐私保护方法,其特征是,步骤(1)具体包括如下步骤:

    (a)对于任意用户ui(i=1,2,...n),提取所有与ui相似性大于阈值参数d的用户,将所有与ui相似性大于阈值参数d的用户加入ui的分组其中,i=1,2,...n,n为正整数;

    (b)对于相似参数s,提取所有与ui相似性大于阈值参数s的用户,将所有与ui相似性大于阈值参数s的用户与ui关联为整体用户;

    (c)重复步骤(a)和(b),直到对所有用户进行分组、以及对强相似用户关联。

    3.根据权利要求2所述针对协同过滤中共谋推断攻击的差分隐私保护方法,其特征是:步骤(b)中,d小于s。

    4.根据权利要求1所述针对协同过滤中共谋推断攻击的差分隐私保护方法,其特征是,步骤(2)具体包括如下步骤:

    (a)将敏感度初始化为0;

    (b)对于任意用户ui(i=1,2,...n),将ui数据从全局用户历史数据矩阵m中删除,得到临近历史数据矩阵m′,其中,i=1,2,...n,n为正整数;

    (c)对于任意用户uj(j=1,2,...n,j≠i),分别计算m和m′中所有内容被推荐给uj的功能性,记为其中,j=1,2,...n,n为正整数,j≠i;

    (d)在推荐k个内容的前提下,计算m和m′中最大的k个推荐功能性之差的总和;

    (e)如果所述推荐功能性之差大于敏感度,则将敏感度替换为推荐功能性之差;

    (f)重复步骤(a)~(e),直到寻找到任意一个用户存在与否对于推荐功能性最大的影响。

    5.根据权利要求1所述针对协同过滤中共谋推断攻击的差分隐私保护方法,其特征是,步骤(3)具体包括如下步骤:

    (a)随机生成一个-0.5到0.5之间的自然数;

    (b)对于任意用户ui(i=1,2,...n),提取所有内容被推荐给ui的功能性,其中,i=1,2,...n,n为正整数;

    (c)对于任意内容cl(l=1,2,...,m),,i=1,2,...m,m为正整数,对将cl推荐给ui的功能性进行干扰,得到干扰功能性具体干扰方法为:

    式中,δf1为敏感度,ε为隐私预算,tmp为步骤(a)所生成的随机数;

    (d)重复步骤(a)~(c),直到将所有内容被推荐给ui的功能性进行干扰;

    (e)为ui推荐干扰后的推荐功能性最大的k个内容。

    6.一种针对协同过滤中共谋推断攻击的差分隐私保护系统,其特征在于:包括用户分组模块、敏感度分析模块和用户推荐模块,所述用户分组模块用于根据用户相似性对用户进行分组,并根据分组结果为用户进行推荐,将强相似用户关联为整体用户,并为整体用户返回相同的推荐结果;所述敏感度分析模块用于在添加差分隐私噪声前进行敏感度计算,分析任意一个用户数据存在与否对于其他任意数据推荐结果的最大影响;所述用户推荐模块用于对推荐功能性添加差分隐私噪声,并根据干扰的功能性为用户进行推荐。

    技术总结
    本发明公开了一种针对协同过滤中共谋推断攻击的差分隐私保护方法,包括如下步骤:根据用户相似性对用户进行分组,并根据分组结果为用户进行推荐,在此基础上,将强相似用户关联为整体用户,并为整体用户返回相同的推荐结果;在添加差分隐私噪声前进行敏感度计算,分析任意一个用户数据存在与否对于其他任意数据推荐结果的最大影响;对推荐功能性添加差分隐私噪声,并根据干扰的功能性为用户进行推荐。本发明关联可能进行共谋攻击的用户,并为之进行统一干扰,防止推断攻击,在此基础上降低差分隐私噪声大小,提升推荐准确性。

    技术研发人员:罗军舟;郭桃林;董恺;杨明
    受保护的技术使用者:东南大学
    技术研发日:2020.11.11
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-20891.html

    最新回复(0)