本发明涉及计算机,具体的,涉及一种基于生物多组学癌症亚型分类方法,还涉及应用该基于生物多组学癌症亚型分类方法的计算机装置,还涉及应用该基于生物多组学癌症亚型分类方法的计算机可读存储介质。
背景技术:
1、大量研究表明,癌症发生的病理机制复杂,可能在细胞层面发生不同的变化,包括遗传或表观遗传修饰改变、转录或翻译障碍以及代谢突变等。随着单细胞测序、时空转录组和核磁共振谱等新一代高通量技术的不断发展,识别和量化这些生物分子层面和细胞层面的病理变化成为可能,从而为研究癌症的机理提供了丰富的大数据。然而,癌症的时间异质性、空间异质性、生物标志物不稳定等挑战要求从多组学角度进行研究,合理地集成生物多组学大数据能够帮助人们更精确地诊断和治疗癌症。
2、目前大多数癌症诊断方法往往使用单一的多组学数据融合方法,要么只使用简单的多组学特征拼接集成,或者独立分析每个组学的数据构建模型,并基于多个模型的平均或多数投票策略进行分析。然而这些方法被设定后就丧失了自适应性,无法在模型学习的过程中动态更新,并且难以充分利用组学数据之间的关联性质,无法利用多组学数据之间的相似和互补信息,动态应用于多组学数据整合,从而减低或避免初始数据的缺陷和改进下游的癌症亚型分类任务。
技术实现思路
1、本发明的第一目的是提供一种可提高癌症亚型分类的预测精度的基于生物多组学癌症亚型分类方法。
2、本发明的第二目的是提供一种可提高癌症亚型分类的预测精度的计算机装置。
3、本发明的第三目的是提供一种可提高癌症亚型分类的预测精度的计算机可读存储介质。
4、为了实现上述第一目的,本发明提供的基于生物多组学癌症亚型分类方法包括:获取目标对象的多组学数据;基于动态图卷积神经网络获取每一个组学数据的特征矩阵;利用注意力机制对每一个组学数据对应的特征矩阵进行分析,获得每一个组学数据的特征嵌入信息的注意力权重矩阵;获取特征嵌入信息的位置编码矩阵,根据注意力权重矩阵和位置编码矩阵获得输入编码矩阵;利用transformer编码器根据输入编码矩阵计算出多组学特征嵌入信息矩阵;根据多组学特征嵌入信息矩阵获得组学交互信息;利用预设分类器对组学交互信息进行预测分类,获得目标对象的癌症亚型分类。
5、由上述方案可见,本发明的基于生物多组学癌症亚型分类方法先利用动态图卷积神经网络获取每一个组学数据的特征矩阵,以获得更高质量的多组学嵌入信息。随后,使用多组学注意力机制、多组学位置编码和多组学集成表示学习来获得更合理的动态数据集成结构以及多组学之间更新的相似性和互补性信息,更好地完成多组学癌症亚型分类任务,提高癌症亚型分类的预测精度。
6、进一步的方案中,基于动态图卷积神经网络获取每一个组学数据的特征矩阵的步骤包括:计算每一个组学数据中样本之间的余弦相似性,获得初始邻接矩阵;获取每一个组学数据的中间邻接矩阵;对初始邻接矩阵和中间邻接矩阵进行加权计算,获得每一个组学数据对应的动态邻接矩阵;利用动态图卷积神经网络对组学数据和对应的动态邻接矩阵进行特征提取,获得每一个组学数据的特征矩阵。
7、由此可见,计算每一个组学数据中样本之间的余弦相似性,并对初始邻接矩阵和中间邻接矩阵进行加权计算,获得每一个组学数据对应的动态邻接矩阵,可自适应学习动态加权图结构,具有更好的特征提取能力。
8、进一步的方案中,利用注意力机制对每一个组学数据对应的特征矩阵进行分析,获得每一个组学数据的特征嵌入信息的注意力权重矩阵的步骤包括:对每一个组学数据所对应的特征矩阵进行平均池化,得到每一个组学数据的特征嵌入信息;利用注意力机制对特征嵌入信息进行处理,获得每一个组学数据的中间权重矩阵;根据中间权重矩阵获得注意力权重矩阵。
9、由此可见,利用注意力机制分析多组学数据并计算注意力权重矩阵,从而获得不同组学的重要性信息。
10、进一步的方案中,利用transformer编码器根据输入编码矩阵计算出多组学特征嵌入信息矩阵的步骤包括:获取三种不同机制的transformer编码器的参数矩阵,根据参数矩阵和输入编码矩阵获得注意力矩阵;根据注意力矩阵获得多组学特征嵌入信息矩阵。
11、由此可见,三种不同机制的transformer编码器的参数矩阵并获得注意力矩阵,分别捕获多组学数据之间的相似性和互补性信息。
12、进一步的方案中,根据参数矩阵和输入编码矩阵获得注意力矩阵的步骤包括:根据参数矩阵和输入编码矩阵获得键矩阵k、查询矩阵q和价值矩阵v;使用点积注意力机制对键矩阵k、查询矩阵q和价值矩阵v进行处理,获得注意力矩阵。
13、由此可见,使用点积注意力机制对键矩阵k、查询矩阵q和价值矩阵v进行处理获得注意力矩阵,可提高计算速度。
14、进一步的方案中,根据注意力矩阵获得多组学特征嵌入信息矩阵的步骤包括:通过注意力矩阵和价值矩阵v的乘积获得更新后的新价值矩阵;对多组新价值矩阵进行聚合拼接得到拼接后的价值矩阵;利用残差项求和的方法对拼接后的价值矩阵进行处理得到每一组学特征嵌入信息矩阵;对每一组学特征嵌入信息矩阵进行组合,获得多组学特征嵌入信息矩阵。
15、由此可见,考虑到在多个组学中,不同的注意力机制从不同视角捕获多个组学信息,对每一组学特征嵌入信息矩阵进行组合获得多组学特征嵌入信息矩阵,提高信息的交互。
16、进一步的方案中,根据多组学特征嵌入信息矩阵获得组学交互信息的步骤包括:获取多组学平均池化后的注意力权重矩阵和多组学残差矩阵;利用连接函数将多组学特征嵌入信息矩阵、多组学平均池化后的注意力权重矩阵和多组学残差矩阵进行连接处理,获得组学交互信息。
17、为了实现本发明的第二目的,本发明提供计算机装置包括处理器以及存储器,存储器存储有计算机程序,计算机程序被处理器执行时实现上述的基于生物多组学癌症亚型分类方法的步骤。
18、为了实现本发明的第三目的,本发明提供的计算机可读存储介质,其上存储有计算机程序,计算机程序被控制器执行时实现上述的基于生物多组学癌症亚型分类方法的步骤。
1.一种基于生物多组学癌症亚型分类方法,其特征在于,包括:
2.根据权利要求1所述的基于生物多组学癌症亚型分类方法,其特征在于:
3.根据权利要求1所述的基于生物多组学癌症亚型分类方法,其特征在于:
4.根据权利要求1所述的基于生物多组学癌症亚型分类方法,其特征在于:
5.根据权利要求4所述的基于生物多组学癌症亚型分类方法,其特征在于:
6.根据权利要求5所述的基于生物多组学癌症亚型分类方法,其特征在于:
7.根据权利要求1至6任一项所述的基于生物多组学癌症亚型分类方法,其特征在于:
8.一种计算机装置,包括处理器以及存储器,其特征在于:所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任意一项所述的基于生物多组学癌症亚型分类方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被控制器执行时实现如权利要求1至7中任意一项所述的基于生物多组学癌症亚型分类方法的步骤。
