买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于深度强化学习的蛋白降解靶向嵌合体连接物生成方法_中山大学_202111473384.5 

申请/专利权人:中山大学

申请日:2021-12-02

公开(公告)日:2024-04-16

公开(公告)号:CN114171125B

主分类号:G16B40/20

分类号:G16B40/20;G16B50/30;G16B15/30;G06N3/0455;G06N3/084;G06N3/092;G06N3/0985

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2022.03.29#实质审查的生效;2022.03.11#公开

摘要:本发明公开了一种基于深度强化学习的蛋白降解靶向嵌合体连接物生成方法,包括步骤如下:使用数据增强方法扩充构建的ZINC数据集和PROTAC数据集,将得到的第一ZINC数据集和第一PROTAC数据集作为监督训练集;构建Transformer模型,并设置训练步数、网络层数、注意力层数和优化器参数;使用第一ZINC数据集训练Transformer模型,使用目标函数和反向传播算法训练更新Transformer模型;使用第一PROTAC数据集训练更新后的Transformer模型,将Transformer模型迁移至PROTAC目标域上,得到Prior先验模型;将片段对SMILES输入Prior先验模型进行批量生成,对生成PROTAC使用打分函数打分,引入强化学习的策略梯度算法,更新Agent模型;重复至PROTAC打分不再提升或者达到训练步数;利用更新后的Agent模型在给定片段对的情况下实现大规模生成符合预期属性的蛋白降解靶向嵌合体连接物。

主权项:1.一种基于深度强化学习的蛋白降解靶向嵌合体连接物生成方法,其特征在于:所述的方法包括步骤如下:使用数据增强方法扩充构建的ZINC数据集和PROTAC数据集,将扩充得到的第一ZINC数据集和第一PROTAC数据集作为监督训练集;构建一个Transformer模型,并设置训练步数、网络层数、注意力层数和优化器参数;使用第一ZINC数据集作为输入训练Transformer模型,根据目标函数和反向传播算法,更新Transformer模型的参数值;使用第一PROTAC数据集作为输入训练更新后的Transformer模型,继续根据所述的目标函数和所述的反向传播算法训练,进一步更新网络权重,将Transformer模型迁移至PROTAC目标域上,得到Prior先验模型;将需要生成连接物的片段SMILES输入Prior先验模型进行批量生成,对生成PROTAC使用制定的打分函数打分,引入强化学习的策略梯度算法,使得打分梯度可被传导,更新Agent模型,以最大化PROTAC打分;重复该步骤至批量生成的PROTAC打分不再提升或者达到一定的训练步数,得到更新后的Agent模型;利用更新后的Agent模型在给定片段的情况下实现大规模生成蛋白降解靶向嵌合体连接物;使用数据增强方法扩充构建的ZINC数据集和PROTAC数据集,具体如下:引入随机SMILES,若输入的标准碎片SMILES左右对换位置,则输出仍为标准完整分子SMILES,得到一条增强数据;若输入中的碎片SMILES随机,且左右位置随机,则输出SMILES随机,得到三条增强数据,最后扩充数据量至原来的5倍,得到扩充后的第一ZINC数据集和第一PROTAC数据集;引入强化学习的策略梯度算法,使得打分梯度可被传导,更新Agent模型,其具体方法如下:将Prior模型学习到的概率分布作为策略,对于采样生成的SMILES,采样概率的乘积则代表Prior模型生成序列的似然值,形式上为: 其中,π为策略,xt为每一步的输入,以学习到的SMILES语法以及PROTAC分子结构的旧策略,也即Prior模型为基础,在此基础上更新策略,得到Agent模型,Agent模型初始化为Prior模型;构建增强似然其为先验似然和获得奖励的组合: 其中,σ是定义参数,其值越大,表现为Agent模型对偏离Prior模型的接受程度越高;表示Prior模型的似然;为打分函数所给打分;增强似然可看作为目标似然;Agent模型的目标是学习一种通过最小化损失函数JΘ=-G来实现期望收益最大化的策略,其中G为: 式中,表示Agent模型的似然,该式使得Agent模型似然尽可能的靠近增强似然,也即目标似然;重复该步骤至批量生成的PROTAC打分不再提升或者达到一定的训练步数之后停止训练,得到更新后的Agent模型。

全文数据:

权利要求:

百度查询: 中山大学 基于深度强化学习的蛋白降解靶向嵌合体连接物生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。