【发明授权】基于强化学习的单一体系的分子生成方法及装置_烟台国工智能科技有限公司_202410077808.3

申请/专利权人：烟台国工智能科技有限公司

申请日：2024-01-19

公开（公告）日：2024-04-09

公开（公告）号：CN117594157B

主分类号：G16C20/50

分类号：G16C20/50;G16C20/70;G06N3/045;G06N3/084;G06N3/092

优先权：

专利状态码：有效-授权

法律状态：2024.04.09#授权;2024.03.12#实质审查的生效;2024.02.23#公开

摘要：基于强化学习的单一体系的分子生成方法及装置，属于分子生成预测技术领域，该方法对收集的分子表达式进行去重处理得到分子数据集；对分子数据集通过原子替换的方式进行扩充，得到扩充数据集并进行去重处理；通过去重处理后的扩充数据集，对Transformer模型进行预训练，得到预训练模型V1；对预训练模型V1进行强化学习处理，得到预训练模型V2；对预训练模型V2进行微调处理，微调处理过程中定量挑选满足条件的分子参与到预训练模型V2的训练，得到微调处理后的预训练模型V3，通过预训练模型V3进行单一体系的新分子生成。本发明显著提高了满足生产要求的新分子的发现效率，大大缩短化学领域内实验室新分子研发的周期。

主权项：1.基于强化学习的单一体系的分子生成方法，其特征在于，包括：从公开数据库中收集分子表达式，对收集的所述分子表达式进行去重处理得到分子数据集；对所述分子数据集通过原子替换的方式进行扩充，得到扩充数据集，对所述扩充数据集进行去重处理；通过去重处理后的所述扩充数据集，对Transformer模型进行预训练，得到预训练模型V1；对所述预训练模型V1进行强化学习处理，得到预训练模型V2；对所述预训练模型V2进行微调处理，微调处理过程中定量挑选满足条件的分子参与到所述预训练模型V2的训练，得到微调处理后的预训练模型V3，通过所述预训练模型V3进行单一体系的新分子生成；通过去重处理后的所述扩充数据集，对Transformer模型进行预训练，得到预训练模型V1的步骤包括：将所述分子数据集中的smiles分子表达式编码为矩阵；将编码矩阵输入Transformer模型并得到分子编码输出；利用交叉熵损失计算分子编码输出与正确smiles分子表达式间的损失值；并采用反向传播更新Transformer模型参数；当Transformer模型经过若干轮次训练损失值趋于稳定时，保存当前Transformer模型作为预训练模型V1；对所述预训练模型V1进行强化学习处理，得到预训练模型V2的步骤包括：利用所述预训练模型V1生成当前批次的分子的smiles表达式；按照设定的评分标准对生成的当前批次的smiles表达式进行评估打分；将评估分数作为所述预训练模型V1的奖励对所述预训练模型V1的权重进行训练；进行若干轮次迭代训练后，保存最后一轮的所述预训练模型V1作为预训练模型V2；设定的评分标准score为：式中，similarity代表生成分子的smiles表达式与单一体系中分子的相似性；当smiles有效时，score赋值为similarity相似度，无效时，score赋值为0；利用交叉熵损失计算分子编码输出与正确smiles分子表达式间的损失值loss1的公式为：loss1＝1+score*loss`1；对所述预训练模型V2进行微调处理的步骤包括：将所述预训练模型V2的参数分别赋给Agent模型和Prior模型，使所述Agent模型参与训练，更新所述预训练模型V2的参数，使所述Prior模型梯度冻结不参与参数更新；利用Agent模型生成分子的smiles表达式，筛选满足设定条件的smiles表达式，当数量满足设定阈值时，停止生成；并通过Prior模型生成同等数量的smiles表达式；将所有生成的smiles表达式汇总，然后输入Agent模型和Prior模型，分别得到Agent模型的输出likelihoodagent和Prior模型的likelihoodprior，并利用Agent模型的输出likelihoodagent和Prior模型的输出likelihoodprior构建损失函数；对损失值取均值，并采用反向传播更新所述预训练模型V2的参数，当所述预训练模型V2经过训练损失值趋于稳定时，保存当前模型作为预训练模型V3；利用Agent模型的输出likelihoodagent和Prior模型的输出likelihoodprior构建的损失函数loss2的公式为：loss2＝likelihoodagent-likelihoodprior2式中，likelihoodagent为Agent模型计算出的smiles表达式的损失值；likelihoodprior为Prior模型计算出的smiles表达式的损失值。

全文数据：

权利要求：

百度查询：烟台国工智能科技有限公司基于强化学习的单一体系的分子生成方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种洗涤设备_重庆海尔洗衣机有限公司_202321535727.0

下一篇：一种无缝钢管送料设备_宁波东进钢管有限公司_202322167126.5

相关技术

一种洗涤设备_重庆海尔洗衣机有限公司_202321535727.0

一种无缝钢管送料设备_宁波东进钢管有限公司_202322167126.5

一种户外交流高压封闭式隔离开关_瑞芯科技(河北雄安)有限公司_202322554260.0

自动装盒设备_杭州永创智能设备股份有限公司_202322265646.X

一种新型加湿器_莆田市必捷电子有限公司_202322599727.3

4G/5G+北斗+Lora机车远程控制装置_宁夏宁东铁路有限公司_202322827126.3

一种卷帘门帘片成型机_重庆久广门业有限公司_202322413811.1

一种可移动升降旋转变形床头置物柜_山西传媒学院_202322018692.X

一种新型带束层鼓防错灯标装置_赛轮(沈阳)轮胎有限公司_202322401683.9

一种点火线圈密封结构_一汽解放汽车有限公司_202322812056.4

一种对氟甲苯制备用精馏设备_湖北联昌新材料有限公司_202322580010.4

一种弹力按摩鞋_温岭市成奇鞋业有限公司_202322137663.5

分子相关技术

一种高分子垫布_江苏晨建布业有限公司_202322651363.9

一种分子筛制氧机_深圳市氧康科技发展有限公司_202322127233.5

一种小分子检测卡_广州德成生物科技有限公司_202322453503.1

一种水分子面料的搓澡巾_青岛新宜家材料科技有限公司_202322675707.X

一种新型分子泵排气接口_信利(仁寿)高端显示科技有限公司_202322747469.9

LiLSX分子筛吸附剂及其制备方法_中国石油化工股份有限公司_202211289631.0

一种碳分子筛造粒装置_上海氧隆科技有限公司_202322407044.3

一种导电高分子非线性光学材料及化学掺杂调控导电高分子非线性吸收性能的方法_同济大学_202110973406.8

膜电极接合体和固体高分子型燃料电池_丰田自动车株式会社_202110577348.7

一种高分子乳化剂罐装装置_山东金奥银雅化工有限公司_202322097758.9

体系相关技术

一种装配式围檩体系_广州宏途设备工程有限公司_202321426756.3

一种支撑体系结构_中建六局土木工程有限公司_202022879563.6

一种全领域产品节点体系动态融合与生长方法_杭州量知数据科技有限公司_202111166990.2

一种自平衡伞壳体系及形成方法_中国建筑设计研究院有限公司_202211011957.7

一种活性原油封堵体系及其制备方法和应用_中国石油大学(北京)_202311072736.5

一种自适应土层承载力要求的结构平台体系_煤炭工业合肥设计研究院有限责任公司_201910092510.9

一种面向任务的运载火箭体系贡献率计算方法_中国人民解放军63921部队_202211592505.2

基于软件通信体系结构的数据传输方法_成都谐盈科技有限公司_202410063128.6

用于检测外泌体miRNA的MDTs-CHA体系、电化学传感器及其应用_南方医科大学南方医院_202110078844.8

一种硫酸长春新碱三元溶剂体系下的程序性干燥方法_广州白云山汉方现代药业有限公司_202211334763.0

单一相关技术

一种洗涤过滤一体机_浙江雅澜洗涤有限公司_202322194414.X

一种水箱散热防冻一体装置_重庆乐航塑料制品有限公司_202322866010.0

一种煎烤一体机_福建南粤厨具股份有限公司_202322582723.4

一种灯具_深圳市飞鹤电子有限公司_202322552729.7

一种受话器_厦门东声电子有限公司_201711423182.3

一种炮台_环翠区凯特塑胶制品厂_202322493011.5

一种便盆_中国人民解放军总医院第三医学中心_202322142543.4

一种童车_爱德华兹新西兰有限公司_202322468159.3

一种垫圈_山西晋煤成达科技工程有限公司_202322352460.8

一种冰箱_海信容声(广东)冰箱有限公司_202011005490.6

龙图腾网&IPTOP

【发明授权】基于强化学习的单一体系的分子生成方法及装置_烟台国工智能科技有限公司_202410077808.3

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务