买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于预训练模型和分子图的药物相互作用效果预测方法_西安电子科技大学_202210625334.2 

申请/专利权人:西安电子科技大学

申请日:2022-06-02

公开(公告)日:2024-04-16

公开(公告)号:CN114882970B

主分类号:G16H20/10

分类号:G16H20/10;G16H70/40;G16H50/70;G06F18/214;G06N3/045;G06N3/084

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2022.08.26#实质审查的生效;2022.08.09#公开

摘要:本发明提出一种基于预训练模型和分子图的药物相互作用效果预测方法,主要解决现有技术缺失对药物分子的特定表示策略和对药物相互作用预测精度较低的问题,其方案为:对不同来源的药物数据进行搜集整理,构建大规模无标签数据集和有标签的下游任务数据集;对每个数据集进行数据清洗、数据生成和数据划分;根据分子之间的信息聚合和药物分子对表示学习的预训练任务构建预训练模型,并基于无标签大样本数据集对其进行预训练得到分子编码器;对分子编码器进行精调后得到预测器,通过预测器对药物‑药物相互作用关系和有效药物组合进行预测。本发明实验流程明晰、耗费资源小、对药物的预测结果准确性高,可用于生物实验。

主权项:1.一种基于预训练模型和分子图的药物相互作用效果预测方法,其特征在于,包括如下:1对不同来源的药物数据进行搜集整理,构建大规模无标签数据集DP;2搜集整理已知的药物-药物相互作用关系数据和已批准的药物组合数据,构建有标签的下游任务数据集:DF={D1,D2,D3,D4},其中,数据集D1和D2表示药物相互作用的二分类数据集,D3表示药物相互作用的多分类数据集,D4表示有效药物组合数据集;3从已有研究中获取人类蛋白质相互作用网络N,从DrugBank数据库中收集所有存在靶标的药物所对应的靶标构成靶标集T;4对无标签数据集DP中的所有药物进行两两组合,得到仅包括药物结构信息的DL数据集,对无标签数据集DP中的药物进行过滤和组合,得到包括靶标信息和药物的结构信息的DS数据集,并将二者共同组成预训练数据集DP'={DL,DS},将其中10%的数据作为测试样本,90%的数据作为训练样本;5对有标签的下游任务数据集DF,将其中所包含的已知相互作用的药物对作为正样本,并随机采取与正样本等量的负样本,得到由正负样本构成的精调数据集DF',将其中20%的数据作为测试样本,80%的数据作为训练样本;6基于预训练数据集DP'和精调数据集DF',构建总预训练图集合GP和总精调图集合GF:7基于药物分子对表示学习的预训练任务构建药物分子对表示学习模型:7a分别设置药物分子对表示学习的遮蔽原子预测和SAB分数预测这两种预训练任务的损失函数,其中,“遮蔽原子预测”用于学习分子图的上下文信息和拓扑信息,“SAB分数预测”用于学习药物分子之间的靶标重叠信息;7b构建由定长向量表示的两个并行输入层,即对于“遮蔽原子预测”任务,输入向量为长度为300的原子列表,对于“SAB分数预测”任务,输入向量为长度为1的靶标邻近分数;7c建立由N个Transformer编码器堆叠构成的隐藏层;7d建立由全连接的神经网络构成的输出层,即对于“遮蔽原子预测”任务,输出层为与字典相同维度的全连接神经网络,对于“SAB分数预测”任务,输出层为输出维度为1的全连接神经网络;7e将7b中的输入层、7c中的隐藏层和7d中的输出层依次串联,得到药物分子对表示学习模型;8使用总预训练图集合GP,通过标准批量梯度下降算法、反向传播算法和Adam优化器对药物分子对表示学习模型进行预训练,预训练过程中的损失函数为交叉熵损失和均方误差损失之和,最终获得一个能够输出节点低维嵌入的分子编码器E;9固定分子编码器E的输入层和Transforme层,并将其预训练头替换为下游任务相关的预测头,使用总精调图集合GF的训练样本集,通过Adam优化器和提前停止策略对分子编码器E中的参数进行微调,得到预测器P;10使用预测器P在总精调图集合GF的测试样本集上进行药物相互作用效果预测:对于多分类样本D3,其预测分数最高的相互作用类别即为预测结果;对于二分类样本D1、D2和D4,其预测分数大于0.5的表示存在相互作用,反之不存在相互作用。

全文数据:

权利要求:

百度查询: 西安电子科技大学 基于预训练模型和分子图的药物相互作用效果预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。