药物靶点结合能预测方法及装置与流程

    专利2022-07-08  158


    本发明涉及药物筛选技术领域,尤其涉及一种蛋白质与配体分子结合自由能的预测方法及装置。



    背景技术:

    通常的药物开发过程包括作用靶点确认、先导化合物筛选与优化、动物实验与临床前实验等基本流程。在药物发现的过程中,基于靶点的结构进行先导化合物的筛选是药物设计流程中的首要阶段。药物的靶点通常指人体内的生物大分子,比如生物体内的酶、离子通道、受体、转运体、dna/rna等。药物分子通过结合自由能与生物体内的靶点产生相互作用,影响相应生物大分子的功能,从而达到调节生物体内代谢、信号传递等目的。

    药物与靶点的相互作用是基于靶点结构进行药物筛选的重中之重。传统的药物筛选是一个高投入、高风险的过程。根据统计,研发一种新药的平均耗时长达12年,花费高达26亿美元。原因之一就是盲目的实验筛选耗费了大量的生物材料和研究人员的宝贵时间。如果能定量计算药物与靶点的结合自由能则能有效的筛选出可以与靶点结合的分子,避免了盲目的筛选。

    药物小分子与靶点的结合可通过解离常数、抑制常数等进行评价。除此之外,根据物理模型可计算药物分子与靶点的结合自由能。通过高通量的筛选,可发现具有和关键靶点蛋白结合的化合物分子。因此,通过定量计算药物分子与靶点的结合自由能被誉为是药物筛选领域的“圣杯”。早在1894年,根据蛋白与小分子化合物结合的过程就提出了著名的“锁=钥”理论,药物筛选本质就是根据已有的靶点寻找到合适的化合物,利用化合物激活或者抑制与疾病相关蛋白的活性。利用计算机辅助药物设计获得了新药研发领域的关注,其中,分子对接(moleculardocking)是一种发展较早较为成熟的计算方法,其通过拟合蛋白质受体与配体之间的相互作用能量,建立一个经验函数,根据基于经验的公式,计算蛋白与配体小分子之间的结合能,可实现快速的结合自由能计算,从而可获得不同配体分子与靶点结合能力的强弱,如果结合能力比较弱的话,则认为该分子不具备成药的潜力。该方法在早期的高通量药物筛选中发挥了重要作用。然而分子对接采用的是经验公式,而公式中的参数是根据当时已有的几百个蛋白-配体分子的结合常数进行拟合的。随着研究的深入,越来越多的靶点结构被解析出来,同时海量的小分子被发现或者通过化学方法合成出来。原有的公式在遇到新的蛋白结构或者新的化合物小分子的时候,计算的能力和精度遇到了瓶颈,无法准确的计算结合自由能。

    随着积累的蛋白与配体分子数据的增多、计算机计算能力的显著提升,如何基于大数据进行精准的结合自由能计算成为目前研究的热点。“人工智能发现分子”被《麻省理工科技评论》评为“2020年十大突破技术”之一。人工智能方法实现了对大数据的分析。借助该方法可从复杂的蛋白与小分子相互作用的结构中得到内在的规律,从而有望利用人工智能方法预测蛋白与配体分子的结合自由能。

    利用人工智能预测蛋白与配体分子的结合自由能的首要步骤是将三维的结构转变为计算机能够快速识读和处理的数字化信息。kireev发明了一种对蛋白与配体分子编码的指纹(structuralprotein-ligandinteractionfingerprints,splif),可以将蛋白与小分子的结构转变为数字信息。但是,在kireev发表在《journalofchemicalinformationandmodeling》中,splif计算方案仅使用了距离蛋白以内的一层结构进行编码,且编码的方式仅用于比较分子对接的结构与已知结构的异同,这种一层编码的方法忽略了蛋白的三维空间信息,所有位于以内的蛋白分子对结合自由能具有相同的权重,造成了预测药物-靶点结合能不准确的问题。



    技术实现要素:

    针对上述问题,本发明提供了一种药物靶点结合能预测方法及装置,有效解决现有方法预测药物-靶点结合能不准确的问题。

    本发明提供的技术方案如下:

    一种药物靶点结合能预测方法,包括:

    s1从pdbbind数据集中获取蛋白与配体分子结合的三维结构,并存储于本地服务器;基于pdb数据库与pdbbind数据库中的晶体结构数据,经过数据预处理,在本地数据库服务器中建立数据库,以存储蛋白质与配体分子的pdb文件;

    s2对所述pdb文件中的数据进行解析,在pdb文件中选定配体分子所在的位置,并按照与配体分子之间距离的远近将蛋白质的结构分割成三层;

    s3将配体分子和分割得到的三层蛋白质分别进行编码,得到蛋白-配体分子相互作用的splif指纹;对本地数据库中所有的分子进行相应的编码,形成训练集、验证集和测试集;

    s4在服务器中建立神经网络模型,利用训练集对其进行训练,并利用测试集对训练后的神经网络模型进行验证,直到得到预设的预测效果;

    s5计算神经网络模型预测得到的结合常数,计算预测值与真实值的皮尔森相关系数和绝对误差,对所述神经网络模型的预测结果进行验证;

    s6使用训练完成的神经网络模型对蛋白质与配体分子结合常数进行预测,并通过阿雷尼乌斯公式将结合常数转变为结合自由,完成对结合自由能的预测。

    一种药物靶点结合能预测装置,包括:

    本地数据库建立模块,用于从pdbbind数据集中获取蛋白与配体分子结合的三维结构,并存储于本地服务器;基于pdb数据库与pdbbind数据库中的晶体结构数据,经过数据预处理,在本地数据库服务器中建立数据库,以存储蛋白质与配体分子的pdb文件;

    蛋白质结构分割模块,用于对所述pdb文件中的数据进行解析,在pdb文件中选定配体分子所在的位置,并按照与配体分子之间距离的远近将蛋白质的结构分割成三层;

    编码模块,将配体分子和分割得到的三层蛋白质,共计四层结构,分别进行编码,得到蛋白-配体分子相互作用的splif指纹;对本地数据库中所有的分子进行相应的编码,形成训练集、验证集和测试集;

    网络训练模块,用于在服务器中建立神经网络模型,利用训练集对其进行训练,并利用测试集对训练后的神经网络模型进行验证,直到得到预设的预测效果;

    预测结果验证模块,用于计算神经网络模型预测得到的结合自由能,与实验结果比较皮尔森相关系数和绝对误差,对所述神经网络模型的预测结果进行验证;及

    结合能预测模块,用于使用训练完成的神经网络模型对蛋白质与配体分子结合常数进行预测,并通过阿雷尼乌斯公式将结合常数转变为结合自由,完成对结合自由能的预测。

    本发明提供的药物靶点结合能预测方法及装置,至少能够带来以下有益效果:

    1)由于在配体结合口袋内,距离配体越近的蛋白结构决定了对配体结合的特异性和结合的强度,本发明中按照与配体分子之间距离的远近将蛋白质的结构分割成三层,并分别进行编码得到相应的splif指纹,分层的蛋白结构能反应蛋白内氨基酸距离配体分子的远近以及空间结构信息,体现了靶点蛋白附近的精细结构异同。相比于如果仅采用一层结构进行预测的技术方案来说,很大程度上提升了对蛋白与配体分子空间结构信息的保留,有利于提升预测的准确性。

    2)由于蛋白与配体分子的结构与结合强度息息相关,是以本发明通过使用编码得到的splif指纹对神经网络模型进行训练,建立splif指纹与结合自由能的非线性关系,进而通过该结构-性质关系,从输入的多层指纹中抽取出关键指纹,实现结合自由能的预测目的,摆脱了通用物理模型对具体案例无法准确描述的束缚。

    附图说明

    下面将以明确易懂的方式,结合附图说明优选实施方式,对上述特性、技术特征、优点及其实现方式予以进一步说明。

    图1为本发明药物靶点结合能预测方法流程示意图;

    图2本发明实施例中基于卷积神经网络的蛋白与配体结合自由能预测的模型结构图;

    图3本发明实施例中基于深度神经网络的蛋白与配体结合自由能预测的模型结构图;

    图4本发明实施例中四层和单层splif指纹使用卷积神经网络时预测的pearson系数对比图;

    图5本发明实施例中四层和单层splif指纹使用深度神经网络时预测的pearson系数对比图;

    图6本发明实施例中四层和单层splif指纹时预测值与真实值的分布对比图。

    具体实施方式

    为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。

    如图1所示为本发明提供的药物靶点结合能预测方法流程示意图,从图中可以看出,该药物靶点结合能预测方法中包括:

    s1从pdbbind数据集中获取蛋白与配体分子结合的三维结构,并存储于本地服务器;基于pdb数据库与pdbbind数据库中的晶体结构数据,经过数据预处理,在本地数据库服务器中建立数据库,以存储蛋白质与配体分子的pdb文件。

    采用的数据来源于pdbbind数据集,该数据集中包含两个不同精度的子数据集,分别为refined数据集和general数据集,其中refined数据集(包含4852个蛋白与与小分子复合物的分子结构)收录了实验获得的解析精度高、抑制系数准确的蛋白与小分子复合物的pdb文件,general数据集(包含11588个蛋白与与小分子复合物的分子结构)中收集了不同解析精度的蛋白与小分子复合物的pdb文件。在对蛋白与小分子结合能预测中,refined数据集和general数据集均可使用,可根据需求选定。对数据进行预处理中,包括对数据进行清洗,删除后续无法编码的文件。

    s2对pdb文件中的数据进行解析,在pdb文件中选定配体分子所在的位置,并按照与配体分子之间距离的远近将蛋白质的结构分割成三层。这里将距离配体分子的蛋白质的微环境划分为三层。为了便于参照,还可将距离配体分子内的蛋白质整体划分为一层作为对照,并将其预测结果与本药物靶点结合能预测方法的预测结果进行比较。另外,在实际应用中,与配体分子之间的距离远近和划分的结构数量均可以根据实际情况进行选定,如在距离配体分子的范围内对蛋白质的微环境进行划分等。

    s3将配体分子和分割得到的三层蛋白质分别进行编码,得到蛋白-配体分子相互作用的splif指纹;对本地数据库中所有的分子进行相应的编码,形成训练集、验证集和测试集。

    训练集、验证集和测试集的比例可根据实际需要限定,如将refined数据集按照7:2:1的比例拆分为训练集和测试集等。为了便于将数据输入神经网络模型,还需对编码得到的splif指纹信息进行哈希处理,将其处理为512、1024等固定长度的向量数据。这一过程中,根据距离配体分子的远近将将蛋白质的结构分割成三层,较好的保留了相对的空间结构信息的同时,分层splif指纹将蛋白与小分子复合物的pdb格式的文件转变为计算机处理的数字编码信息,能更好的处理化合物的结构信息。

    将距离配体分子内的蛋白质整体划分为1层作为对照。将距离配体分子内的蛋白质整体划分为三层,将配体分子作为一层,相当于包含了四层编码结构,以此该步骤中将配体分子和四层蛋白质分别进行编码,得到蛋白-配体分子相互作用的splif指纹,并根据编码后的信息对训练集、验证集和测试集进行划分。

    s4在服务器中建立神经网络模型,利用训练集对其进行训练,并利用测试集对训练后的神经网络模型进行验证,直到得到预设的预测效果;

    建立的神经网络模型可以根据实际情况进行限定,如构建卷积神经网络模型、深度神经网络模型等。在训练过程中,配体分子和蛋白质分层结构的splif指纹信息作为输入,结合常数为输出量。该神经网络模型能够对编码信息进行有效的学习,从分子指纹中分析出潜在的规律,通过非线性的拟合的方式建立组合指纹与结合自由能之间的非线性关系。各神经元内部的计算方法如下式:

    z(l)=w(l)·a(l-1) b(l)

    a(l)=fl(z(l))

    其中,z(l)为线性计算,w(l)为从权重举证,a(l-1)为神经元的输入,b(l)为偏置矩阵,fl(z(l))为激活函数,进行了非线性计算,通过从前一层到后一层的信息传递,建立了指纹与结合自由能的非线性关系。激活函数包括但不限于softsign、tanh、relu等。

    具体,当创建的神经网络模型为卷积神经网络模型时,该卷积神经网络模型中包括:两个卷积层、两个最大池化层、一个全连接层及一个dropout层。当创建的神经网络模型为深度神经网络模型时,该深度神经网络模型中包括:两层隐藏层,第一隐藏层包含2048个神经元,第二隐藏层包含1024个神经元,且每层后面跟一个丢失比率为0.1的dropout层。深度神经网络模型能够对编码信息进行深度的学习,通过前馈信息传递和反向传播算法,分析分子的结构指纹与结合自由能的关系,达到预测结合自由能的目的。

    s5计算神经网络模型预测得到的结合常数,计算预测值与真实值的皮尔森相关系数和绝对误差,对神经网络模型的预测结果进行验证。具体,通过如下式计算pearson系数定量比较预测值与真实值之间的拟合关系r2

    其中,pkexp为实验测得的结合常数,为实验测得的结合常数的平均值,pkcal为通过本方法预测得到的结合常数,为通过本方法预测得到的结合常数的平均值。

    s6使用训练完成的神经网络模型对蛋白质与配体分子结合常数进行预测,并通过如下式的阿雷尼乌斯公式将结合常数转变为结合自由,完成对结合自由能的预测:

    其中,pkcal为本方法预测得到的结合常数,δg为结合自由能,kb为玻尔兹曼常数,t为绝对温度。

    相对应的,本发明还提供了一种药物靶点结合能预测装置,应用于上述药物靶点结合能预测方法,该药物靶点结合能预测装置中包括:本地数据库建立模块,用于从pdbbind数据集中获取蛋白与配体分子结合的三维结构,并存储于本地服务器;基于pdb数据库与pdbbind数据库中的晶体结构数据,经过数据预处理,在本地数据库服务器中建立数据库,以存储蛋白质与配体分子的pdb文件;蛋白质结构分割模块,用于对pdb文件中的数据进行解析,在pdb文件中选定配体分子所在的位置,并按照与配体分子之间距离的远近将蛋白质的结构分割成三层;编码模块,将配体分子和分割得到的三层蛋白质分别进行编码,得到蛋白-配体分子相互作用的splif指纹;对本地数据库中所有的分子进行相应的编码,形成训练集、验证集和测试集;网络训练模块,用于在服务器中建立神经网络模型,利用训练集对其进行训练,并利用测试集对训练后的神经网络模型进行验证,直到得到预设的预测效果;预测结果验证模块,用于计算神经网络模型预测得到的结合自由能,与实验结果比较皮尔森相关系数和绝对误差,对神经网络模型的预测结果进行验证;及结合能预测模块,用于使用训练完成的神经网络模型对蛋白质与配体分子结合常数进行预测,并通过阿雷尼乌斯公式将结合常数转变为结合自由,完成对结合自由能的预测。

    一实例中,以构建卷积神经网络模型为例对预测方法流程做出说明,如图2所示,具体包括如下步骤:

    s1从pdbbind数据集中获取蛋白与配体分子结合的三维结构(对应图2中的蛋白与配体分子复合物),并存储于本地服务器;选取refined和general两个数据集进行后续的计算,对数据进行清洗,删除无法编码的文件,建立本地数据库,存储蛋白质与配体分子的pdb文件;

    s2对pdb文件中的数据进行解析,在pdb文件中选定配体分子所在的位置,并按照与配体分子之间距离()的远近将蛋白质的结构分割成三层;并将距离配体分子内的蛋白质整体划分为一层作为对照(对应图2中对蛋白结构分层)。

    s3将配体分子和分割得到的三层蛋白质分别进行编码,得到蛋白-配体分子相互作用的splif指纹,并对每层编码后的splif指纹信息进行哈希处理转换为固定的512长度向量数据,四层结构,共计得到长度为2048的向量。对本地数据库中所有的分子进行相应的编码,形成训练集、验证集和测试集。

    s4在服务器中建立卷积神经网络模型,利用训练集对其进行训练,并利用测试集对训练后的神经网络模型进行验证,直到得到预设的预测效果。该卷积神经网络模型中包括:卷积层、最大池化层、卷积层、最大池化层、全连接层、dropout层及全连接层。训练中,将提取的蛋白与配体分子相互作用的四层splif指纹信息输入该卷积神经网络模型中,对蛋白与配体分子的特征进行学习。

    s5计算神经网络模型预测得到的结合常数,计算预测值与真实值的皮尔森相关系数和绝对误差,对神经网络模型的预测结果进行验证,并分析本发明分层编码方式的优势。

    s6使用训练完成的神经网络模型对蛋白质与配体分子结合常数进行预测,并通过阿雷尼乌斯公式将结合常数转变为结合自由,完成对结合自由能的预测。

    另一实例中,以构建深度神经网络模型为例对预测方法流程做出说明,如图3所示,具体包括如下步骤:

    s1从pdbbind数据集中获取蛋白与配体分子结合的三维结构(对应图3中的蛋白与配体分子复合物),并存储于本地服务器;选取refined和general两个数据集进行后续的计算,对数据进行清洗,删除无法编码的文件,建立本地数据库,存储蛋白质与配体分子的pdb文件;

    s2对pdb文件中的数据进行解析,在pdb文件中选定配体分子所在的位置,并按照与配体分子之间距离()的远近将蛋白质的结构分割成三层;并将距离配体分子内的蛋白质整体划分为一层作为对照(对应图3中对蛋白结构分层)。

    s3将配体分子和分割得到的三层蛋白质分别进行编码,得到蛋白-配体分子相互作用的splif指纹,并对编码后的splif指纹信息进行哈希处理转换为固定的2048长度向量数据。对本地数据库中所有的分子进行相应的编码,形成训练集、验证集和测试集。

    s4在服务器中建立深度神经网络模型,利用训练集对其进行训练,并利用测试集对训练后的神经网络模型进行验证,直到得到预设的预测效果。该深度神经网络模型中包括:全连接层、dropout层、全连接层、dropout层及全连接层其中,第一个全连接层包含2048个神经元,第二个全连接层含1024个神经元,且每层后面跟一个丢失比率为0.1的dropout层。训练中,将提取的蛋白与配体分子相互作用的四层splif指纹信息输入该深度神经网络模型中,对蛋白与配体分子的特征进行学习。

    s5计算神经网络模型预测得到的结合常数,计算预测值与真实值的皮尔森相关系数和绝对误差,对神经网络模型的预测结果进行验证,并分析本发明分层编码方式的优势。

    s6使用训练完成的神经网络模型对蛋白质与配体分子结合常数进行预测,并通过阿雷尼乌斯公式将结合常数转变为结合自由,完成对结合自由能的预测。

    图4为四层和单层splif指纹使用卷积神经网络时预测的pearson系数比对图,图5为四层和单层splif指纹使用深度神经网络时预测的pearson系数比对图,从图中可以看出,在refined和general两个数据集中,采用四层splif指纹的预测结果计算得到的pearson系数均高于单层splif指纹的预测结果计算得到的pearson系数,显然预测效果更好。图6为采用四层splif指纹的预测值与真实值的分布,其中,(a)为采用卷积神经网络模型的预测值与真实值的分布,(b)为采用深度神经网络模型的预测值与真实值的分布,根据图中所示,两种预测模型的预测值均能跟真实值很好的吻合,验证了组合指纹在传统机器学习方法中通用性的同时,对本发明提供的预测方法进行了验证。本发明将splif指纹从结构相似性比较拓展到基于结构的结合自由能预测中,并提出多层指纹编码方式,有效的提高了计算的准确度。应当说明的是,本发明实施例中对蛋白结构的划分不限于四层,其他采用相似结构划分方法但采用不同层数的发明,应视为本发明的保护范围。

    应当说明的是,上述实施例均可根据需要自由组合。以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通相关人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。


    技术特征:

    1.一种药物靶点结合能预测方法,其特征在于,包括:

    s1从pdbbind数据集中获取蛋白与配体分子结合的三维结构,并存储于本地服务器;基于pdb数据库与pdbbind数据库中的晶体结构数据,经过数据预处理,在本地数据库服务器中建立数据库,以存储蛋白质与配体分子的pdb文件;

    s2对所述pdb文件中的数据进行解析,在pdb文件中选定配体分子所在的位置,并按照与配体分子之间距离的远近将蛋白质的结构分割成三层;

    s3将配体分子和分割得到的三层蛋白质分别进行编码,共计四层结构,得到蛋白-配体分子相互作用的splif指纹;对本地数据库中所有的分子进行相应的编码,形成训练集、验证集和测试集;

    s4在服务器中建立神经网络模型,利用训练集对其进行训练,并利用测试集对训练后的神经网络模型进行验证,直到得到预设的预测效果;

    s5计算神经网络模型预测得到的结合常数,计算预测值与真实值的皮尔森相关系数和绝对误差,对所述神经网络模型的预测结果进行验证;

    s6使用训练完成的神经网络模型对蛋白质与配体分子结合常数进行预测,并通过阿雷尼乌斯公式将结合常数转变为结合自由,完成对结合自由能的预测。

    2.如权利要求1所述的药物靶点结合能预测方法,其特征在于,在步骤s2中,将距离配体分子的蛋白质的微环境划分为三层;

    在步骤s3中,将配体分子、三层分割的蛋白质,共计四组结构分别进行编码,得到蛋白-配体分子相互作用的splif指纹;

    在步骤s4中,将提取的蛋白与配体分子相互作用的四层splif指纹输入神经网络模型中,对蛋白与配体分子的特征进行学习,完成对神经网络模型的训练和验证;

    在步骤s5中,将提取的蛋白与配体分子相互作用的四层splif指纹输入神经网络模型,对蛋白与配体分子的结合自由能进行预测。

    3.如权利要求1或2所述的药物靶点结合能预测方法,其特征在于,在步骤s4中,创建的神经网络模型为卷积神经网络模型,包括:两个卷积层、两个最大池化层、一个全连接层及一个dropout层。

    4.如权利要求1或2所述的药物靶点结合能预测方法,其特征在于,在步骤s4中,创建的神经网络模型为深度神经网络模型,包括:两层隐藏层,第一隐藏层包含2048个神经元,第二隐藏层包含1024个神经元,且每层后面跟一个丢失比率为0.1的dropout层。

    5.一种药物靶点结合能预测装置,其特征在于,包括:

    本地数据库建立模块,用于从pdbbind数据集中获取蛋白与配体分子结合的三维结构,并存储于本地服务器;基于pdb数据库与pdbbind数据库中的晶体结构数据,经过数据预处理,在本地数据库服务器中建立数据库,以存储蛋白质与配体分子的pdb文件;

    蛋白质结构分割模块,用于对所述pdb文件中的数据进行解析,在pdb文件中选定配体分子所在的位置,并按照与配体分子之间距离的远近将蛋白质的结构分割成三层;

    编码模块,将配体分子和分割得到的三层蛋白质分别进行编码,得到蛋白-配体分子相互作用的splif指纹;对本地数据库中所有的分子进行相应的编码,形成训练集、验证集和测试集;

    网络训练模块,用于在服务器中建立神经网络模型,利用训练集对其进行训练,并利用测试集对训练后的神经网络模型进行验证,直到得到预设的预测效果;

    预测结果验证模块,用于计算神经网络模型预测得到的结合自由能,与实验结果比较皮尔森相关系数和绝对误差,对所述神经网络模型的预测结果进行验证;及

    结合能预测模块,用于使用训练完成的神经网络模型对蛋白质与配体分子结合常数进行预测,并通过阿雷尼乌斯公式将结合常数转变为结合自由,完成对结合自由能的预测。

    6.如权利要求5所述的药物靶点结合能预测装置,其特征在于,在蛋白质结构分割模块中,将距离配体分子的蛋白质的微环境划分为三层;

    在编码模块中,将配体分子和三层蛋白质分别进行编码,得到包含四层结构的蛋白-配体分子相互作用的splif指纹;

    在网络训练模块中,将提取的蛋白与配体分子相互作用的四层splif指纹输入神经网络模型中,对蛋白与配体分子的特征进行学习,完成对神经网络模型的训练和验证;

    在自由能预测模块中,将提取的蛋白与配体分子相互作用的四层splif指纹输入神经网络模型,对蛋白与配体分子的结合自由能进行预测。

    7.如权利要求5或6所述的药物靶点结合能预测装置,其特征在于,在网络训练模块中,创建的神经网络模型为卷积神经网络模型,包括:两个卷积层、两个最大池化层、一个全连接层及一个dropout层。

    8.如权利要求5或6所述的药物靶点结合能预测装置,其特征在于,在网络训练模块中,创建的神经网络模型为深度神经网络模型,包括:两层隐藏层,第一隐藏层包含2048个神经元,第二隐藏层包含1024个神经元,且每层后面跟一个丢失比率为0.1的dropout层。

    技术总结
    本发明提供了一种药物靶点结合能预测方法及装置,其中,方法包括:S1构建本地数据库;S2在pdb文件中选定配体分子所在的位置,并按照与配体分子之间距离的远近将蛋白质的结构分割成三层;S3将配体分子和分割得到的三层蛋白质分别进行编码,得到蛋白‑配体分子相互作用的SPLIF指纹,并形成训练集、验证集和测试集;S4在服务器中建立神经网络模型,利用训练集对其进行训练,并利用测试集对训练后的神经网络模型进行验证;S5计算神经网络模型预测得到的结合常数;S6使用训练完成的神经网络模型对蛋白质与配体分子结合常数进行预测,并通过阿雷尼乌斯公式将结合常数转变为结合自由,有效解决现有方法预测药物‑靶点结合能不准确的问题。

    技术研发人员:谢良旭;许晓军;许磊
    受保护的技术使用者:江苏理工学院;江苏省中以产业技术研究院
    技术研发日:2020.11.27
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-14351.html

    最新回复(0)