本发明涉及肿瘤分子生物学,具体涉及一种基于蛋白组学的高级别浆液性卵巢癌免疫分型模型的构建方法,进一步的,本发明还涉及一种基于蛋白组学的高级别浆液性卵巢癌免疫分型模型的应用。
背景技术:
1、卵巢癌是全球女性癌症死亡的第八大常见原因。上皮性卵巢癌作为最常见的卵巢癌类型,约占卵巢癌的90%,致死率极高,全球每年约有>185,000名妇女死于上皮性卵巢癌。上皮性卵巢癌的常见组织学亚型包括浆液性卵巢癌、粘液性卵巢癌、子宫内膜样腺癌和透明细胞癌。其中,高级别浆液性卵巢癌(high-grade serous ovarian cancer,hgsoc)是上皮性卵巢癌的最常见也是最致命的亚型。尽管在过去的几十年上皮性卵巢癌的治疗已取得了可喜的进展,但hgsoc目前缺乏有效的治疗手段,生存率在过去的几十年来一直未有提升,患者的5年生存率保持在~40%。因此,迫切需要持续开发新疗法,确定从新疗法中获益的患者,并制定最佳治疗策略。
2、hgsoc预后不良和缺乏有效治疗方法的特点,推动了研究人员对使用蛋白组学技术进行分析的浓厚兴趣。蛋白质组学的范围包括多个方面,例如蛋白质鉴定和定量、蛋白质-蛋白质相互作用、翻译后修饰和功能分析。随着质谱分析深度的提高,研究人员已经在蛋白质组学水平上对多种癌症的特征进行了阐述。最近的几项研究探讨了蛋白质组学分析在hgsoc中的重要作用,揭示了hgsoc的不同分子分型,提出了hgsoc发生的潜在生物学途径及过程。然而,使用大型队列对hgsoc进行蛋白质组学水平的分析仍然十分有限。
3、近年来,恶性肿瘤的免疫治疗领域取得了显著进展,特别是免疫检查点抑制剂(immune checkpoint inhibitors,icis)成功治疗了多种恶性肿瘤,如黑色素瘤、肾癌、膀胱癌、非小细胞肺癌和霍奇金病。然而,icis在卵巢癌中的临床效果欠佳,临床试验中单药的客观缓解率仅约10-15%,这可能归因于卵巢癌的独特病理特征及免疫微环境特征。已有研究观察到hgsoc中不同的t细胞浸润模式,并将其分为免疫浸润型、排斥型和沙漠型,不同的浸润模式可导致对免疫治疗的不同应答结局。一些研究强调了hgsoc在单细胞转录组水平的肿瘤内异质性。然而,关于hgsoc的免疫相关特征仍然知之甚少。通过基于蛋白质组学的方法研究肿瘤免疫微环境可以为生物标志物的开发和hgsoc中的icis潜在获益群体选择标准提供有价值的见解。
技术实现思路
1、本发明的目的在于针对现有技术的不足,提供一种基于蛋白组学的高级别浆液性卵巢癌免疫分型模型的构建方法及其应用。
2、本发明的目的是通过以下技术方案来实现的:
3、一种基于蛋白组学的高级别浆液性卵巢癌免疫分型模型的构建方法,所述的免疫分型模型的构建方法包括以下步骤:
4、(1)资料收集:对高级别浆液性卵巢癌患者进行无标签的蛋白组学测序,获取蛋白组学测序结果、临床信息及预后信息数据构建训练数据集;
5、(2)基于细胞类型组成的免疫分型的鉴定:通过xcell计算训练数据集中每个样本中64种不同细胞类型的丰度,基于xcell标签的标志化z评分,使用共识聚类将具有相似免疫/基质特征的样本归为一类,识别出三种具有不同生物学特征和不同预后的免疫分型:ic1、ic2和ic3,并对每一种亚型进行通路富集分析,得到每种亚型的特征性生物学通路;
6、(3)结合步骤(2)的分型结果及对应的临床信息及预后信息进一步对晚期hgsoc进行分析,将其分为免疫分型中两种分型,并通过将202个免疫相关基因与晚期hgsoc中预后相关基因取交集,筛选出基因;利用机器学习算法对筛选得到的基因进行进一步特征选择和构建基于蛋白组学的高级别浆液性卵巢癌免疫分型模型,并根据各模型在高级别浆液性卵巢癌样本的一致性指数(concordance index,c-index)选出最优的蛋白标志物组合并获得构建好的基于蛋白组学的高级别浆液性卵巢癌免疫分型模型。
7、进一步地,通过电子病历系统,获取高级别浆液性卵巢癌患者的临床信息;通过门诊系统、电话随访的方式获取所述高级别浆液性卵巢癌患者的预后信息数据。
8、进一步地,从geo数据库获取两个独立的外部数据集中高级别浆液性卵巢癌患者的表达谱数据及临床、预后信息。
9、进一步地,使用r软件的consensusclusterplus包进行共识聚类,将具有相似免疫/基质特征的样本归为一类,识别出三种具有不同生物学特征和不同预后的免疫分型:ic1、ic2和ic3。
10、进一步地,利用r软件的“clusterprofiler”包对基因本体(go)和京都基因与基因组百科全书(kegg)通路进行富集分析,错误发现率(fdr)阈值小于0.05提示显著性。同时,使用相同的r包对整个蛋白表达基质进行基因集富集分析(gsea),得到每一种亚型的富集通路。
11、进一步地,根据免疫分型对高级别浆液性卵巢癌患者的生存进行差异分析,采用log-rank检验,并绘制kaplan-meier生存曲线;其中,ic1型预后最佳,ic2型预后最差,ic3型为预后中间型,所述免疫分型与晚期高级别浆液性卵巢癌患者的预后显著相关。
12、进一步地,将202个免疫相关基因与晚期hgsoc中预后相关基因取交集,筛选出以下24个基因:elav1、adar、tbk1、syk、ctsl、rela、map2k2、grb2、mapk14、rabep2、chp1、itgb2、rac2、prdx1、map2k1、vim、ltbp1、hla-b、nrp1、tubb3、eng、hla-drb1、nras、isg15。
13、进一步地,通过72种算法组合,包含gbm、superpc、survival-svm、ridge、enet、plsrcox、lasso、stepcox、rsf中的一种或多种,采用c-index为筛选指标,筛选出最优蛋白标志物组合为isg15、itgb2和rela,及最优特征选择方法为gbm,最优模型构建算法为superpc。
14、进一步地,使用上述筛选到的基因及模型构建方法,将tcga-ov-201612和pxd010372队列中的晚期高级别浆液性卵巢癌分为两种亚型(ic-1、ic-2),采用log-rank检验对两种亚型的生存差异进行分析,并绘制kaplan-meier生存曲线。
15、进一步地,独立外部数据集验证结果发现,所述蛋白标志物可区分晚期高级别浆液性卵巢癌为两种免疫亚型,且两种亚型生存结局具有显著差异。
16、进一步地,所述蛋白标志物可用于制作试剂盒,用于识别晚期高级别浆液性卵巢癌中免疫治疗的潜在获益患者,预测晚期高级别浆液性卵巢癌患者的生存结局。
17、具体地,一种蛋白标志物组合的检测试剂在制备晚期高级别浆液性卵巢癌免疫分型预后预测试剂盒中的应用;所述检测试剂为检测所述蛋白标志物组合中各蛋白表达量的试剂;所述蛋白标志物组合为isg15、itgb2和rela。
18、本发明还提供了一种用于晚期高级别浆液性卵巢癌免疫分型的系统,包括免疫分型模块,用于将待分型的晚期高级别浆液性卵巢癌患者的蛋白标志物组合的表达数据输入所述构建方法构建获得的基于蛋白组学的高级别浆液性卵巢癌免疫分型模型中,获得分型结果。所述免疫分型与晚期高级别浆液性卵巢癌患者的预后显著相关。其中,ic1型预后佳,ic2型预后差。
19、本发明的有益效果是:本技术通过蛋白质组学分析,将高级别浆液性卵巢癌分成具有不同特征及生存结局的免疫亚型,同时对晚期高级别浆液性卵巢癌进行了进一步的分型,并鉴定出了用于区分高级别浆液性卵巢癌的蛋白标志物组合。本发明提供一种基于蛋白组学的高级别浆液性卵巢癌免疫分型的构建及应用。基于蛋白质组学和生物信息学分析,能够有效识别具有预测价值的蛋白标志物组合,从而识别高级别浆液性卵巢癌的免疫治疗潜在获益者,并为晚期高级别浆液性卵巢癌生存结局的预测提供依据。
1.一种基于蛋白组学的高级别浆液性卵巢癌免疫分型模型的构建方法,其特征在于,所述的免疫分型模型的构建方法包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,使用r软件的consensusclusterplus包进行共识聚类。
3.根据权利要求2所述的方法,其特征在于,consensusclusterplus的参数设置为:reps=1000,pitem=0.8,pfeature=1,clusteralg="hc",distance="spearman",plot="pdf"。
4.根据权利要求1所述的方法,其特征在于,所述通过将202个免疫相关基因与晚期hgsoc中预后相关基因取交集,筛选出的基因为elav1、adar、tbk1、syk、ctsl、rela、map2k2、grb2、mapk14、rabep2、chp1、itgb2、rac2、prdx1、map2k1、vim、ltbp1、hla-b、nrp1、tubb3、eng、hla-drb1、nras、isg15。
5.根据权利要求1所述的方法,其特征在于,机器学习算法包括广义增强回归模型、监督主成分、生存-向量机、ridge、弹性网络、cox的偏最小二乘回归、lasso、逐步cox、随机生存森林中的一种或多种组合。
6.根据权利要求1所述的方法,其特征在于,获得构建好的基于蛋白组学的高级别浆液性卵巢癌免疫分型模型是基于监督主成分构建和训练的。
7.根据权利要求1所述的方法,其特征在于,所述最优蛋白标志物组合为isg15、itgb2和rela。
8.一种蛋白标志物组合的检测试剂在制备晚期高级别浆液性卵巢癌免疫分型预后预测试剂盒中的应用,其特征在于,所述检测试剂为检测所述蛋白标志物组合中各蛋白表达量的试剂;所述蛋白标志物组合为isg15、itgb2和rela。
9.一种用于晚期高级别浆液性卵巢癌免疫分型的系统,其特征在于,包括免疫分型模块,用于将待分型的晚期高级别浆液性卵巢癌患者的蛋白标志物组合的表达数据输入至权利要求1-7任一项所述构建方法构建获得的基于蛋白组学的高级别浆液性卵巢癌免疫分型模型中,获得分型结果。
10.根据权利要求9所述的系统,其特征在于,所述免疫分型与晚期高级别浆液性卵巢癌患者的预后显著相关。