基于多视图数据增强与图对比学习的序列推荐方法及系统

    专利2025-02-28  13


    本发明属于数据处理,更进一步涉及电数字数据处理中的一种基于多视图数据增强与图对比学习的序列推荐方法及系统。本发明根据交互数据构建多种视图,通过图神经网络融合对比学习的技术,为互联网上的用户提供序列推荐服务。


    背景技术:

    1、序列推荐通过利用历史交互序列中的时间顺序信息,学习用户信息并预测用户下一个可能交互的物品。一些专利提出了基于神经网络的方法来有效地学习用户信息,例如:通过基于循环神经网络或自注意力机制的模型捕获用户长短期信息变化,尽管这些方法在推荐性能上有了一定的改进,但受制于交互序列数据的稀疏性问题,现有方法对数据中存在的噪声信息过度敏感,容易导致推荐模型出现过拟合,泛化性能不强等问题。

    2、中南大学在其申请的专利文献“基于对比学习的序列推荐方法及系统”(申请号为202311366797.2,申请公布号:cn117216602a)中公开了一种序列推荐的方法。该方法的实现步骤是:收集用户与项目的历史交互行为序列数据,根据嵌入层进行编码,得到用户和与用户有交互记录的项目的初始嵌入表示;将初始嵌入表示输入滤波器组进行滤波,得到去噪嵌入表示;根据行为序列数据通过聚类算法得到用户意图信息;使用以前馈神经网络为主体的序列编码器结合去噪嵌入表示,作为第一训练输入;通过对比自监督算法将用户意图信息与序列编码器的输出序列表征相结合,作为第二训练输入;将第一训练输入和第二训练输入同时用于序列推荐模型的训练;得到预测评分,最终进行序列预测。该方法存在的不足之处是,聚类算法难以有效区分用户的细粒度信息,同时在利用对比学习技术时,对物品构建正负样本对容易受到单个物品噪声信息的影响,导致推荐精度不高。

    3、山东师范大学在其申请的专利文献“基于协同注意力网络和对比学习的序列推荐方法及系统”(申请号为202310113975.4,申请公布号:cn 115982480 a)中公开了一种序列推荐方法。该方法的实现步骤是:构建时序交互图,分别学习用户节点和项目节点的初始嵌入、时间嵌入和位置嵌入,得到节点统一嵌入;将节点统一嵌入输入至协同注意力网络中,更新节点同一嵌入,得到用户和项目的最终节点嵌入表示;基于用户和项目的初始嵌入,构建语义感知的对比学习目标;将用户和项目的最终节点嵌入表示进行内积操作,生成用户对项目的预测得分,根据预测得分输出项目推荐序列;最后利用构建的对比学习损失函数和交叉熵损失函数,联合优化对比学习目标和推荐目标。该方法存在的不足之处是,融合用户节点与物品节点不同类型的嵌入表征后,使用同一个神经网络进行优化,会导致训练过程中不同种类的语义信息互相影响,对物品和用户的嵌入向量的参数学习产生噪声,导致推荐性能不强。

    4、中国科学技术大学在其申请的专利文献“基于图对比学习的序列推荐数据增强方法”(申请号为202211604474.8,申请公布号:cn 115795334 a)中公开了一种序列推荐方法。该方法的实现步骤是:获取真实应用场景中用户的历史行为序列,并对原始数据预处理;根据预处理得到的用户行为序列,统计各个物品对之间的多阶连接信息,再根据统计信息计算全局图中各物品之间边的权重并进行归一化,并设定阈值过滤噪声信息,最终构建出全局图;对于每一个物品,以一定概率开展邻域采样获取两个增强子图,并采用lightgcn作为编码器,在不同的视图中使用共享参数;使用分桶聚类的方法进行负采样,缓解物品表征的分布并不均匀的负面影响;利用胶囊网络进行兴趣提取;对预测任务和对比学习任务进行联合优化。该方法存在的不足之处是,利用对比学习技术时,对物品构建正负样本对容易受到单个物品噪声信息的影响,同时对多个模块输出的嵌入向量进行融合时,直接做concat操作,无法在多种语义信息间构建联系,为用户提供物品推荐序列不够准确。


    技术实现思路

    1、本发明的目的是针对上述现有技术的不足,提出一种基于多视图数据增强与图对比学习的序列推荐方法及系统,用于解决模型对噪声信息过度敏感,易过拟合,泛化性能不强的问题。

    2、实现本发明目的的技术思路是:本发明根据序列交互数据分别构建加权序列转换全局图和物品相关性全局图,其次通过在两个全局图上开展物品节点的邻居采样,为每一个全局图构建一对增强子图,并利用共享图神经网络学习增强子图对中物品的嵌入表征,提取用户与物品交互的高阶动态信息,使得能够在考虑序列交互数据的基础上,更全面地捕捉用户的全局信息,缓解交互序列数据稀疏性的不足。本发明采用图对比学习方法来区分增强子图对中不同序列嵌入表征代表的用户信息,保持增强子图对中相同序列嵌入表征代表的用户信息的一致性,有助于更好地区分用户间的信息差异,同时通过联合优化推荐目标与对比学习目标,使得模型参数的学习更加稳定,缓解了过拟合的缺陷。本发明通过将两个全局图学到的用户嵌入表征与序列编码器模块学习到的位置嵌入表征相融合作为用户的最终嵌入表征,充分捕获用户的全局信息与局部变化信息,提高了序列推荐的准确性。

    3、根据上述思路,本发明方法的实现步骤包括如下:

    4、分别构建加权序列转化全局图和物品相关性全局图,通过对每个全局图进行邻居节点采样实现数据增强,利用图神经网络捕获用户的意图信息,通过联合优化对比学习目标和推荐目标迭代更新用户嵌入向量与物品嵌入向量,并将每个用户优化后的嵌入向量和物品的嵌入向量进行内积,生成用户对物品的评分,根据评分排序输出物品的推荐序列。

    5、本发明的系统包括数据处理模块,数据增强模块,图神经网络模块,优化模块,预测模块;其中:

    6、所述数据处理模块,用于构建加权序列转换全局图和物品相关性全局图;

    7、所述数据增强模块,用于对全局图进行邻居节点采样,实现数据增强;

    8、所述图神经网络模块,用于利用图神经网络捕获用户的意图信息;

    9、所述优化模块,用于通过联合优化对比学习目标和推荐目标迭代更新用户嵌入向量与物品嵌入向量;

    10、所述预测模块,用于将每个用户优化后的嵌入向量和物品的嵌入向量进行内积,生成用户对物品的评分,根据评分排序输出物品的推荐序列。

    11、本发明可通过包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序的电子设备实现基于多视图数据增强与图对比学习的序列推荐方法的所有步骤。

    12、本发明可通过存储有计算机程序的计算机可读存储介质,实现基于多视图数据增强与图对比学习的序列推荐方法的所有步骤。

    13、本发明与现有技术相比有以下优点:

    14、第一,由于本发明的序列推荐方法中分别构建的加权序列转换全局图和物品相关性全局图,缓解了现有技术易受到数据稀疏性影响的问题。使得本发明能够在考虑序列交互数据的基础上,全面地捕捉用户的全局信息,可为用户提供更准确的推荐服务。

    15、第二,由于本发明的序列推荐方法中对每个全局图进行邻居节点采样实现数据增强,并利用图神经网络捕获用户的意图信息,缓解了现有技术对用户行为模式理解不足的问题,使得本发明的方法有助于学习用户的隐藏信息,更好地适应不断变化的用户行为模式,推荐结果更贴近用户的实际需求。

    16、第三,由于本发明的序列推荐方法中通过联合优化对比学习目标和推荐目标迭代更新用户嵌入向量与物品嵌入向量,克服了现有技术易过拟合的缺陷,使得本发明有助于更好地区分不同用户间的信息差异,提高了模型的泛化性能,在真实推荐场景中具有更好的适用性。

    17、第四,由于本发明的序列推荐系统中的数据处理模块、数据增强模块,可以对稀疏的用户交互数据进行高效处理和增强,扩充模型的训练样本,使得本发明在面对处理大规模且稀疏的交互数据时表现出色,能够为用户提供准确和多样化的推荐。

    18、第五,由于本发明的序列推荐系统可在包括存储器、处理器以及存储器中的计算机程序的电子设备或存储有计算机程序的计算机可读存储介质上实现,使得本发明具备了广泛的应用可行性和灵活性,用户可以在各种设备上享受到高效的推荐服务。


    技术特征:

    1.一种基于多视图数据增强与图对比学习的序列推荐方法,其特征在于,分别构建加权序列转化全局图和物品相关性全局图,通过对每个全局图进行邻居节点采样实现数据增强,利用图神经网络捕获用户的意图信息,通过联合优化对比学习目标和推荐目标迭代更新用户嵌入向量与物品嵌入向量,并将每个用户优化后的嵌入向量和物品的嵌入向量进行内积,生成用户对物品的评分,根据评分排序输出物品的推荐序列。

    2.根据权利要求1所述基于多视图数据增强与图对比学习的序列推荐方法,其特征在于,所述加权序列转化全局图的构建步骤如下:

    3.根据权利要求2所述基于多视图数据增强与图对比学习的序列推荐方法,其特征在于,所述物品相关性全局图的构建步骤如下:

    4.根据权利要求1所述基于多视图数据增强与图对比学习的序列推荐方法,其特征在于,所述数据增强是指:利用graphsage的邻居采样方法,分别对加权序列转化全局图和物品相关性全局图中的节点进行邻居采样,保留每个全局图中采样节点之间的边及其权重,生成一对加权序列转化全局图的增强子视图和一对物品相关性全局图的增强子视图;其中,采样深度为2,采样大小为50。

    5.根据权利要求1所述基于多视图数据增强与图对比学习的序列推荐方法,其特征在于,所述捕获用户的意图信息指的是,将每个全局图的增强子视图输入到共享图神经网络lightgcn中,输出表示用户的意图信息的嵌入向量。

    6.根据权利要求1所述基于多视图数据增强与图对比学习的序列推荐方法,其特征在于,所述联合优化指的是,利用对比学习损失函数infonce,构建不同用户对应的对比学习目标,利用交叉熵损失函数生成推荐目标,通过反向传播算法,同时优化对比学习目标和推荐目标,迭代更新用户嵌入向量和物品的嵌入向量,得到优化后的用户嵌入向量和物品的嵌入向量。

    7.根据权利要求1所述方法的一种基于多视图数据增强与图对比学习的序列推荐系统,其特征在于,包括数据处理模块,数据增强模块,图神经网络模块,优化模块,预测模块;其中:

    8.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现如权利要求1-7中任一项所述一种基于多视图数据增强与图对比学习的序列推荐方法的步骤。

    9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述一种基于多视图数据增强与图对比学习的序列推荐方法的步骤。


    技术总结
    本发明公开了一种基于多视图数据增强与图对比学习的序列推荐方法及系统,其实现方案包括:分别构建加权序列转化全局图和物品相关性全局图,通过对每个全局图进行邻居节点采样实现数据增强,利用图神经网络捕获用户的意图信息,通过联合优化对比学习目标和推荐目标迭代更新用户嵌入向量与物品嵌入向量,将每个用户优化后的嵌入向量和物品的嵌入向量进行内积,生成用户对物品的评分,根据评分排序输出物品的推荐序列。本发明能有效捕捉用户全局信息,适应不断变化的用户行为模式,不易受到数据稀疏性的影响,具有较强的泛化性能,为用户提供准确和多样化的推荐。

    技术研发人员:慕彩红,于海坤,刘逸,陈云龙,王蓉芳,冯婕
    受保护的技术使用者:西安电子科技大学
    技术研发日:
    技术公布日:2024/4/29
    转载请注明原文地址:https://wp.8miu.com/read-83537.html

    最新回复(0)