买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于迭代搜索策略的蛋白质溶剂可及性预测方法_浙江工业大学_202011030157.0 

申请/专利权人:浙江工业大学

申请日:2020-09-27

公开(公告)日:2021-01-12

公开(公告)号:CN112216345A

主分类号:G16B30/00(20190101)

分类号:G16B30/00(20190101);G16B50/30(20190101)

优先权:

专利状态码:有效-授权

法律状态:2021.12.17#授权;2021.01.29#实质审查的生效;2021.01.12#公开

摘要:一种基于迭代搜索策略的蛋白质溶剂可及性预测方法,首先,根据输入的待测定溶剂可及性的蛋白质序列信息,使用HHBlits工具生成对应的多序列联配信息,进而生成对应的位置特异性频率矩阵,同时,对PDB数据库中每条蛋白质序列也进行上述操作;其次,计算输入的蛋白质序列的位置特异性频率矩阵和PDB数据库中每条蛋白质的位置特异性频率矩阵的相似度;然后,从PDB数据库中获取与输入蛋白质相似度最高的多条蛋白质序列及结构信息,并将其作为模板蛋白质;再次,使用DSSP工具计算每条模板蛋白质的溶剂可及性信息;最后,根据模板蛋白质的溶剂可及性信息,预测输入蛋白质序列的溶剂可及性。本发明计算代价低、预测精度高。

主权项:1.一种基于迭代搜索策略的蛋白质溶剂可及性预测方法,其特征在于,所述预测方法包括以下步骤:1输入蛋白质残基个数为L的待进行溶剂可及性预测的蛋白质序列信息,记作S;2对给定的蛋白质序列S,使用HHBlits工具生成对应的多序列联配信息,记作其中表示MSA中的第n条序列联配信息,N为MSA中的序列联配信息总数目,每条序列联配信息均含有L个元素,每个元素均属于元素集合R={R1,…,Rr,…,R21},集合R是由二十种常见氨基酸和补位空格元素组成的;3对给定的多序列联配信息MSA,生成对应的位置特异性频率矩阵,记作其中表示中的第l个元素,当与Rr为相同元素类型时,否则4对任意两条蛋白质序列SX与SY,给定它们的多序列联配信息MSAX与MSAY,使用如下步骤计算它们之间的相似度simSX,SY,并获得它们的序列比对信息ali,过程如下:4.1根据MSAX与MSAY,使用步骤3获得SX与SY对应的位置特异性频率矩阵与4.2构造相似度矩阵其中4.3根据相似度矩阵XY,使用Needleman-Wunsch动态规划算法获得SX与SY的序列比对信息ali,并计算SX与SY的其中,当alilX≠-1时,alilX为SY中与SX的第lX个残基比对上的残基索引值且否则,alilX表示与SX的第lX个残基比对上是补位空格元素且5对PDB库中的每条蛋白质使用步骤2生成对应的多序列联配信息组成多序列联配信息集合,记作其中I表示PDB库中蛋白质序列的总数目;6根据输入序列S的多序列联配信息MSA与步骤5中生成的集合,使用步骤4计算MSA与集合中每个元素的相似度,并获取相似度最高的M个元素对应的PDB数据库中的蛋白质序列及序列比对信息,组成一个新的多序列联配信息MSAnew用于更新替换输入序列S的原始MSA,然后再执行步骤6,上述迭代过程直至输入序列S的MSA信息收敛时终止;7对步骤6获得的MSA中含有的每条PDB数据库蛋白质根据对应的三维结构信息,使用DSSP工具计算对应的溶剂可及性信息,组成溶剂可及性信息集合,记作其中为对应的溶剂可及性信息,表示中第l个残基的溶剂可及性信息;8根据步骤7获得的输入蛋白质序列S的溶剂可及性信息被预测为其中为S中第l个残基的溶剂可及性信息,当aliml≠-1时,aliml为MSA中第m条序列中与S的第l个残基比对上的残基索引值且否则,aliml表示与S的第l个残基比对上是补位空格元素且

全文数据:

权利要求:

百度查询: 浙江工业大学 一种基于迭代搜索策略的蛋白质溶剂可及性预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。