买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于多层级可解释性表征的最优分子子结构选取方法_重庆大学_202311705332.5 

申请/专利权人:重庆大学

申请日:2023-12-13

公开(公告)日:2024-04-12

公开(公告)号:CN117877623A

主分类号:G16C20/40

分类号:G16C20/40

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.30#实质审查的生效;2024.04.12#公开

摘要:本发明涉及一种基于多层级可解释性表征的最优分子子结构选取方法,由两部分组成:多层级分子混合表征模块和预测器。多层级分子混合表征模块用于学习分子图表征、化学可合成子结构表征和分子3D空间结构表征,可以很好的提取分子结构的局部、全局和空间结构信息。然后将分子图表征、化学可合成子结构表征和分子3D空间结构表征拼接得到多层分子混合特征向量。最后将多层分子混合特征向量和对应的目标性质输入到三个前馈神经网络模型FNN中进行训练,训练好的FNN可以快速输出化学课合成分子子结构对目标性质的回归值,根据该回归值可以进行分子设计的快速筛选。

主权项:1.一种基于多层级可解释性表征的最优分子子结构选取方法,其特征在于:包括如下步骤:S1:从现有公开数据中获取若干条SMILES字符串和对应的性质标签,将每条SMILES字符串转化为分子图,所述性质标签即目标性质;S2:将分子图作为输入,通过有向消息传递神经网络对分子图进行表征得到分子图表征;S3:将分子图作为输入,通过BRICS方法将分子图拆分为若干个分子子结构,以分子子结构为节点,将分子结构重新表示为基于分子子结构的树状结构,并通过有向消息传递神经网络对基于分子子结构的树状结构进行表征获得化学可合成的子结构表征;S4:将SMILES字符串作为输入,通过Uni-Mol预训练模型获取SMILES字符串对应的分子结构的分子3D空间结构表征;S5:将分子图表征、化学可合成的子结构表征、分子3D空间结构表征进行拼接获得分子多层级表征,每个分子多层级表征对应一个SMILES字符串和一个性质标签;S6:以前馈神经网络FNN作为预测器,分子多层级表征和其性质标签作为预测器的输入对预测器进行训练,通过贝叶斯优化算法对预测器的超参数进行优化,计算预测器的10则交叉验证预测结果,当预测器收敛函数不变小则得到训练好的预测器;S7:将待测的分子结构的SMILES字符串转化为待测分子图,使用S3中的方法将待测分子图分解为若干个待测分子子结构,将若干个待测分子子结构输入训练好的预测器,输出为每个分子子结构相对于性质标签的回归值,回归值越大表示分子子结构对目标性质的贡献越大。

全文数据:

权利要求:

百度查询: 重庆大学 一种基于多层级可解释性表征的最优分子子结构选取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。