申请/专利权人:国际商业机器公司
申请日:2020-01-15
公开(公告)日:2024-03-19
公开(公告)号:CN111489794B
主分类号:G16C20/30
分类号:G16C20/30;G16C20/70;G16C60/00
优先权:["20190128 US 16/259706"]
专利状态码:有效-授权
法律状态:2024.03.19#授权;2020.08.28#实质审查的生效;2020.08.04#公开
摘要:提供了一种用于创建预测模型的方法,该预测模型从作为描述化合物的特征向量的序列数据中预测化合物的化学性质。序列数据包括多个数据序列。该方法包括:生成用于预测目标变量y并使用贝叶斯准则和变分近似来学习的概率预测模型y*。该方法包括将模型配置为i为从序列数据中提取的特征向量中的每一个特征向量分配多个预测函数中的一个预测函数,ii识别第i个数据中的第t个向量与目标变量y之间的关系,以及iii识别特征向量和目标变量y之间的关系的相似性。该方法包括使用模型来识别序列长度,序列长度在多个数据序列之间是可变的。该方法包括基于模型预测目标变量y,作为化合物的化学性质。
主权项:1.一种用于创建预测模型的计算机实现的方法,所述预测模型从作为描述化合物的一组特征向量的序列数据中预测所述化合物的化学性质,所述序列数据包括多个数据序列,所述方法包括:由硬件处理器生成用于预测目标变量y并使用贝叶斯准则和变分近似来学习的概率预测模型y*,所述概率预测模型y*用于确定是否应将多个输入数据序列中的数据的特征向量添加到其他输入数据序列中的数据;由所述硬件处理器将所述概率预测模型y*配置为i为从所述输入数据序列中的数据中提取的所述特征向量中的每一个特征向量分配多个预测函数中的一个预测函数,ii识别所述输入数据序列中的第i个数据中的第t个特征向量与所述目标变量y之间的关系,以及iii识别所述特征向量和所述目标变量y之间的关系的相似性;由所述硬件处理器使用所述概率预测模型y*来识别序列长度,所述序列长度在所述多个数据序列之间是可变的;由所述硬件处理器基于所述概率预测模型y*来预测所述目标变量y,作为所述化合物的化学性质;以及基于所述目标变量y的所述预测,形成新化合物,所述目标变量y作为所述新化合物的构成元素。
全文数据:
权利要求:
百度查询: 国际商业机器公司 用于创建预测模型的方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。