本发明涉及妊娠期糖尿病智能判断系统,具体涉及一种智能判断模型的构建方法及系统、一种用于妊娠期糖尿病的智能判断系统、一种电子设备和一种计算机可读存储介质。
背景技术:
1、妊娠期糖尿病是糖尿病的一种,是指在妊娠期首次发现或发生的糖代谢异常,可能导致胎儿发育畸形、胎儿宫内窘迫、胎死宫内新生儿低血糖、巨大儿以及难产或者死产等并发症。患有妊娠期糖尿病的母亲所生的婴儿暴露于化学失衡的风险增加,因此早期准确的检测至关重要。在临床中,通常采用口服葡萄糖耐量试验以对妊娠期糖尿病进行诊断。然而,这种主流方法需要在服用葡萄糖之前和之后多次检查血糖水平,具有侵入性的,耗时的、劳动密集型的特点。此外,在妊娠早期,口服葡萄糖耐量试验对迟发性妊娠期糖尿病的敏感性和特异性较低。因此,这种方法不适合早期发现,临床上仍然迫切需要更多无创的、准确的生物标志物,以用于妊娠期糖尿病的临床判断。
2、机器学习作为现代信息学科人工智能的重要分支,使用算法解析大量数据并从中学习和归纳问题,从而可以通过模拟人类大脑思维的学习方式作出推理或判断。机器学习常用的算法有很多,例如按学习风格可分为监督学习、无监督学习、半监督学习等,按形式或功能的相似性可分为分类、回归、决策树、聚类、深度学习等。近年来,机器学习和临床诊断相结合虽然取得了一些进展,但受限于医学样本数据特点和各种算法的适用性,尤其是针对妊娠期糖尿病诊断,目前尚未发现于此相关的具有高准确率的基于机器学习的智能判断模型。
技术实现思路
1、基于上述现状,本发明的主要目的在于提供一种用于妊娠期糖尿病判断的智能判断模型的构建方法、构建系统、智能判断系统、电子设备和介质,所述构建方法将样本中的蛋白质标志物数据经预处理后用于机器学习模型,并在经过训练和评估的机器学习模型的基础上得到具有最佳准确率的智能判断模型,从而能够基于泪液生物标志物准确地、高效地诊断妊娠期糖尿病。
2、为实现上述目的,本发明采用的技术方案如下:
3、本发明的第一方面提供了一种智能判断模型的构建方法,所述智能判断模型用于妊娠期糖尿病的判断,所述方法包括如下步骤:
4、s100,获取多个样本中的蛋白质标志物数据,并作为用于构建所述智能判断模型的原始数据集;
5、s200,通过所述原始数据集对预选机器学习模型进行训练和评估,并根据评估结果得到所述智能判断模型;
6、其中,所述步骤s100中的所述蛋白质标志物数据包括如下标志物的泪液蛋白浓度数据:
7、磷酸丙糖异构酶(tpis),
8、α-烯醇化酶1(enoa),和
9、肽酰脯氨酰异构酶b(ppib)。
10、优选地,所述步骤s100中,所述多个样本从包括孕中期正常孕妇和孕中期妊娠期糖尿病孕妇的受试者的泪液中收集。
11、优选地,所述步骤s200还包括:
12、所述步骤s200包括:
13、s210,通过z值算法对所述原始数据集进行缩放处理并得到预处理数据;
14、s220,随机将所述预处理数据分为训练集和测试集,通过所述训练集对预选机器学习模型进行训练并得到训练模型,并通过所述测试集对所述训练模型进行评估,确定最优训练模型;
15、s230,生成可用于单个样本的数据转换程序,所述数据转换程序根据所述z值算法所采用的参数对所述智能判断模型的输入数据进行处理,将所述数据转换程序与所述最优训练模型进行集成并得到集成模型;
16、s240,对所述集成模型进行性能评估,根据所述性能评估的结果得到所述智能判断模型。
17、优选地,所述步骤s220中,所述通过所述训练集对所述预选机器学习模型进行训练并得到训练模型包括:
18、s221,将所述磷酸丙糖异构酶(tpis)、α-烯醇化酶1(enoa)和肽酰脯氨酰异构酶b(ppib)的泪液蛋白浓度数据作为最优特征子集。
19、优选地,所述步骤s220中,所述通过所述训练集对所述预选机器学习模型进行训练并得到训练模型包括:
20、s222,采用交叉验证并得到模型评估结果,基于所述模型评估结果确定最优超参数,根据所述最优超参数得到所述训练模型。
21、优选地,所述步骤s240中,所述对所述集成模型进行性能评估包括:
22、s241,绘制roc曲线,并计算所述集成模型的auc值。
23、优选地,所述训练集和测试集的比例为7:3,所述交叉验证为十折交叉验证。
24、优选地,所述预选机器学习模型包括深度神经网络、线性支持向量机、径向基核函数支持向量机、随机梯度下降、随机森林。
25、本发明的第二方面提供了一种智能判断模型的构建系统,所述智能判断模型用于妊娠期糖尿病的判断,所述构建系统包括:
26、输入单元,用于获取多个样本中的蛋白质标志物数据,并作为用于构建所述智能判断模型的原始数据集;
27、建模单元,用于通过所述原始数据集对预选机器学习模型进行训练和评估,并根据评估结果得到所述智能判断模型;
28、其中,所述蛋白质标志物数据包括如下标志物的泪液蛋白浓度数据:
29、磷酸丙糖异构酶(tpis),
30、α-烯醇化酶1(enoa),和
31、肽酰脯氨酰异构酶b(ppib)。
32、优选地,所述多个样本包括孕中期正常孕妇和孕中期妊娠期糖尿病孕妇的泪液样本。
33、优选地,所述建模单元包括:
34、数据模块,用于通过z值算法对所述原始数据集进行缩放处理并得到预处理数据;
35、训练模块,用于随机将所述预处理数据分为训练集和测试集,通过所述训练集对预选机器学习模型进行训练并得到训练模型,并通过所述测试集对所述训练模型进行评估,确定最优训练模型;
36、构建模块,用于生成可用于单个样本的数据转换程序,所述数据转换程序根据所述z值算法所采用的参数对所述智能判断模型的输入数据进行处理,将所述数据转换程序与所述最优训练模型进行集成并得到集成模型;
37、评估模块,用于对所述集成模型进行性能评估,根据所述性能评估的结果得到所述智能判断模型。
38、优选地,所述训练模块的最优特征子集为磷酸丙糖异构酶(tpis)、α-烯醇化酶1(enoa)和肽酰脯氨酰异构酶b(ppib)的泪液蛋白浓度数据。
39、优选地,所述训练模块包括第一子模块,所述第一子模块能够采用交叉验证并得到模型评估结果,基于所述模型评估结果确定最优超参数,根据所述最优超参数得到所述训练模型。
40、优选地,所述评估模块还用于绘制roc曲线,并计算所述集成模型的auc值。
41、优选地,所述训练集和测试集的比例为7:3,所述交叉验证为十折交叉验证。
42、优选地,所述预选机器学习模型包括深度神经网络、线性支持向量机、径向基核函数支持向量机、随机梯度下降、随机森林。
43、本发明的第三方面提供了一种用于妊娠期糖尿病的智能判断系统,所述智能判断系统包括:
44、输入模块,用于输入待判断数据,所述待判断数据包括受试者的磷酸丙糖异构酶(tpis)、α-烯醇化酶1(enoa)和肽酰脯氨酰异构酶b(ppib)的泪液蛋白浓度数据;
45、判断模块,用于对所述待判断数据进行判断,所述判断模块包括根据上述第一方面所述的构建方法得到的智能判断模型;
46、输出模块,用于输出所述待判断数据的判断结果,以得到所述受试者的妊娠期糖尿病患病概率。
47、优选地,所述智能判断模型基于随机森林模型得到。
48、本发明的第四方面提供了一种电子设备,包括:处理器;以及存储器,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时,能够实现如上述第一方面所述的构建方法。
49、本发明的第五方面提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序用于运行以实现如上述第一方面所述的构建方法。
50、本发明与现有技术相比具有明显的优点和有益效果,其至少具有下列优点:
51、本发明的智能判断模型的构建方法及构建系统,基于多个受试者样本获取可用于诊断妊娠期糖尿病的蛋白质标志物数据,将磷酸丙糖异构酶,α-烯醇化酶1和肽酰脯氨酰异构酶b的泪液蛋白浓度数据作为模型构建的原始数据集,并基于原始数据集对预选机器学习模型进行训练和评估,从而得到用于判断妊娠期糖尿病的智能判断模型,由此该智能判断模型适用于大规模队列的妊娠期糖尿病诊断,基于优选出来的最佳机器学习模型和适用的蛋白质标志物能够有效判别妊娠期糖尿病,并具备非侵入性和良好的性能表现,该智能判断模型预测正确率的最佳auc值可在0.98以上。
52、本发明的用于妊娠期糖尿病的智能判断系统,该智能判断系统的判断模块包括根据上述构建方法得到的智能判断模型,能够基于多个样本中的蛋白质标志物数据(包括磷酸丙糖异构酶、α-烯醇化酶1和肽酰脯氨酰异构酶b的泪液蛋白浓度数据)进行快速、准确的妊娠期糖尿病诊断,实现快速分析、判断样本数据并输出结果,从而为临床应用提供一种有效的、非侵入性的妊娠期糖尿病判断方法。
53、本发明的电子设备和计算机可读存储介质,通过采用上述构建方法能够得到用于妊娠期糖尿病的智能判断模型,该智能判断模型能够基于泪液蛋白质标志物为大规模队列提供快速、准确的妊娠期糖尿病判断,有助于实现非侵入性的基于机器学习的妊娠期糖尿病诊断。
1.一种智能判断模型的构建方法,所述智能判断模型用于妊娠期糖尿病的判断,其特征在于,所述方法包括如下步骤:
2.如权利要求1所述的构建方法,其特征在于,所述步骤s100中,所述多个样本从包括孕中期正常孕妇和孕中期妊娠期糖尿病孕妇的受试者的泪液中收集。
3.如权利要求1所述的构建方法,其特征在于,所述步骤s200包括:
4.如权利要求3所述的构建方法,其特征在于,所述步骤s220中,所述通过所述训练集对所述预选机器学习模型进行训练并得到训练模型包括:
5.如权利要求3所述的构建方法,其特征在于,所述步骤s220中,所述通过所述训练集对所述预选机器学习模型进行训练并得到训练模型包括:
6.如权利要求3所述的构建方法,其特征在于,所述步骤s240中,所述对所述集成模型进行性能评估包括:
7.如权利要求5所述的构建方法,其特征在于,所述训练集和测试集的比例为7:3,所述交叉验证为十折交叉验证。
8.如权利要求1-7任一项所述的构建方法,其特征在于,所述预选机器学习模型包括深度神经网络、线性支持向量机、径向基核函数支持向量机、随机梯度下降、随机森林。
9.一种智能判断模型的构建系统,所述智能判断模型用于妊娠期糖尿病的判断,其特征在于,所述构建系统包括:
10.如权利要求9所述的构建系统,其特征在于,所述多个样本包括孕中期正常孕妇和孕中期妊娠期糖尿病孕妇的泪液样本。
11.如权利要求9所述的构建系统,其特征在于,所述建模单元包括:
12.如权利要求11所述的构建系统,其特征在于,所述训练模块的最优特征子集为磷酸丙糖异构酶(tpis)、α-烯醇化酶1(enoa)和肽酰脯氨酰异构酶b(ppib)的泪液蛋白浓度数据。
13.如权利要求11所述的构建系统,其特征在于,所述训练模块包括第一子模块,所述第一子模块能够采用交叉验证并得到模型评估结果,基于所述模型评估结果确定最优超参数,根据所述最优超参数得到所述训练模型。
14.如权利要求11所述的构建系统,其特征在于,所述评估模块还用于绘制roc曲线,并计算所述集成模型的auc值。
15.如权利要求13所述的构建系统,其特征在于,所述训练集和测试集的比例为7:3,所述交叉验证为十折交叉验证。
16.如权利要求9至15任一项所述的构建系统,其特征在于,所述预选机器学习模型包括深度神经网络、线性支持向量机、径向基核函数支持向量机、随机梯度下降、随机森林。
17.一种用于妊娠期糖尿病的智能判断系统,其特征在于,所述智能判断系统包括:
18.如权利要求17所述的判断系统,其特征在于,所述智能判断模型基于随机森林模型得到。
19.一种电子设备,其特征在于,包括:
20.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序用于运行以实现如权利要求1至8任一项所述的构建方法。